ECONOMETRIA BASICA 



Quinta edigao 


Damodar N. Gujarati 
Dawn C. Porter 


Grew (^5^1 















EDITORA AF ILIAD A 




Econometria 



Quinta Ediyao 


Damodar N. Gujarati 

Professor Emerito de Economia, 

United States Military Academy, West Point 

Dawn C. Porter 

University of Southern California 

Tradu^ao 

Denise Durante 
Monica Rosemberg 
Maria Liicia G. L. Rosa 

Revisao Tecnica 

Claudio D. Shikida 

Doutor em Economia pelo PPGE-UFRGS, professor do IBMEC-MG 

Ari Francisco de Araujo Junior 

Mestre em Economia pela UFMG, professor do IBMEC-MG 
Marcio Antonio Salvato 

Doutor em Economia pela FGV-RJ, professor do IBMEC-MG 


Versao impressa 
desta obra: 2011 



AMGH Editora 



2011 







Obra originalmente publicada sob o tltulo 
Basic Econometrics, 5th edition 
ISBN 0-07-337577-2/978-0-07-337577-9 

© 2008, The McGraw-Hill Companies, Inc., New York, NY, EUA 

Editora senior: Luciana Salgado Guimara.es Moreira 

Editora assistente: Luciana Cruz 

Assistente editorial: Cesar Crivelaro 

Preparagao do original: Monica de Aguiar Rocha 

Capa: TrialI Composigao Editorial Ltda., arte sobre capa original 

Diagramagao: Triall Composigao Editorial Ltda 


Reservados todos os direitos de publicagao, ern lingua portuguesa, a 
AMGH Editora Ltda. (AMGH Editora e uma parceria entre 
Artmed® Editora S.A. e McGraw-Hill Education) 

Av. Jeronimo de Ornelas, 670 - Santana 

90040-340 Porto Alegre RS 

Fone (51) 3027-7000 Fax (51)3027-7070 

E proibida a duplicagao ou reprodugao deste volume, no todo ou em parte, 
sob quaisquer formas ou por quaisquer meios (eletronico, mecanico, gravagao, 
fotocopia, distribuigao na Web e outros) sem permissao expressa da Editora. 

SAOPAULO 

Av. Embaixador Macedo Soares, 10.735 - Pavilhao 5 - Cond. Espace Center 
Vila Anastacio 05095-035 Sao Paulo SP 
Fone (11) 3665-1100 Fax (11)3667-1333 

SAC 0800 703-3444 


IMPRESSO NO BRASIL 
PRINTED IN BRAZIL 


Para Joan Gujarati, Diane Gujarati-Chesnut, 
Charles Chesnut e meus netos, 

Tommy e Laura Chesnut. 


—DNG 


Para Judy, Lee, Brett, Bryan, Amy e Autumn Porter. 
Especialmente para meu amado pai, Terry. 


—DCP 


V 


Sobre os autores 


Damodar N. Gujarati 

Apos lecionar por mais de 25 anos na Universidade da Cidade de Nova York e 17 no Departa- 
mento de Ciencias Sociais da Academia Militar de West Point, Nova York, Gujarati atualmente e 
professor emerito de economia na Academia. Graduou-se na Universidade de Bombaim em 1960, 
concluiu o MBA na Universidade de Chicago em 1963 e o doutorado na Universidade de Chicago 
em 1965. Gujarati tem um extenso numero de publica£6es em periodicos renomados nos Estados 
Unidos e internacionalmente, como Review of Economics and Statistics, Economic Journal, Journal 
of Financial and Quantitative Analysis e Journal of Business. Foi membro do Conselho de Editores 
do Journal of Quantitative Economics, veiculo oficial da Journal of the Indian Econometric Society. 
Tambem e autor dos tftulos Pensions and the New York City fiscal crisis (American Enterprise Institute, 
1978), Government and business (McGraw-Hill, 1984) e Essentials of econometrics (McGraw-Hill, 
3. ed., 2006). Seus livros sobre econometria foram traduzidos para varios idiomas. 

Gujarati foi professor visitante na Universidade de Sheffield, Reino Unido (1970-1971), em 
Fulbright, India (1981-1982), na Escola de Administrate da Universidade Nacional de Cingapura 
(1985-1986) e professor visitante de Econometria na Universidade de New South Wales, Australia 
(verao de 1988). Lecionou extensivamente topicos sobre micro e macroeconomia em palses como 
Australia, China, Bangladesh, Alemanha, India, Israel, Ilhas Mauricio e Coreia do Sul. 


Dawn C. Porter 

Dawn Porter e professora assistente do Departamento de Gestao de lnforma 5 ao e Opera 9 oes da 
Marshall School of Business na University of Southern California desde 2006. E professora de esta- 
tlstica tanto no curso de gradua£ao quanto no curso de MBA na escola de administrate. Antes de 
juntar-se ao corpo docente da USC, de 2001-2006, foi professora assistente da McDonough School of 
Business na Universidade de Georgetown e anteriormente foi professora visitante do Departamento 
de Psicologia da Graduate School of Arts and Sciences da Universidade de Nova York (NYU). Na 
NYU, lecionou diversos cursos sobre metodos estatlsticos avancados e foi professora da Stern School 
of Business, onde obteve o doutorado em Estatlstica. 

Suas areas de interesse em pesquisa incluem analise categorica, medidas de acordo, modelagem 
multivariada e aplica£6es no campo da psicologia. Sua pesquisa atual examina modelos de leilao 
on-line sob uma perspectiva estatlstica. Apresentou sua pesquisa na Joint Statistical Meetings, no 
Decision Sciences Institute, no International Conference on Information Systems, em diversas uni- 
versidades incluindo a London School of Economics e a NYU, assim como em varios seminarios de 
e-commerce e estatlstica. E tambem coautora do livro Essentials of business statistics, 2. ed., 
McGraw-Hill Irwin, 2008. Fora do mundo academico, Dawn trabalha como consultora estatlstica 
para a KPMG, Inc. Atuou ainda como consultora para muitas outras grandes empresas como Ginnie 
Mae, Inc., Toys R Us Corporation, IBM, Cosmaire, Inc. e para o Centro Medico da NYU. 



Agradecimentos 


Desde a publicagao da primeira edigao deste livro, em 1978, recebemos valiosos conselhos, co- 
mentarios, criticas e sugestoes de diversas pessoas. Gostarfamos de agradecer em especial a ajuda re- 
cebida de Michael McAleer, da University of Western Australia, Peter Kennedy, da Simon Frazer 
University, Canada, de Kenneth White, da University of British Columbia, George K. Zestos, da 
Christopher Newport University, Virginia, e de Paul O finer, da Georgetown University, Washington, D.C. 

Tambem somos gratos aqueles que nos influenciaram por sua erudigao. Gostariamos de agradecer 
especialmente a Arthur Goldberger, da University of Wisconsin, William Greene, da New York 
University e ao falecido G. S. Maddala. Continuamos gratos aos seguintes revisores que ofereceram 
suas inestimaveis percepgoes, criticas e sugestoes nas edicoes anteriores deste texto: Michael A. Grove, 
da University of Oregon, Harumi Ito, da Brown University, Ham Kim, da South Dakota University, 
Phanindra V. Wunnava, do Middlebury College, e Andrew Paizis, da City University of New York. 

Varios autores influenciaram a redagao deste texto. Em particular, somos gratos aos seguintes: 
Chandan Mukherjee, diretor do Centro de Estudos do Desenvolvimento, Trivandrum, India; Howard 
White e Marc Wuyts, do Institute of Social Studies, na Holanda; Badi H. Baltagi, da Texas A&M Uni¬ 
versity; B. Bhaskara Rao, da University of New South Wales, Australia; R. Carter Hill, da Louisiana 
University; William E. Griffiths, da University of New England; George G. Judge, University of 
California, Berkeley; Mamo Verbeek, do Centro de Estudos Economicos da KU Leuven; Jeffrey 
Wooldridge, da Michigan State University; Kerry Patterson, da University of Reading, Reino Unido; 
Francis X. Diebold, da Wharton School, University of Pennsylvania; Wojciech W. Charemza e Derek 
F. Deadman, da University of Leicester, Reino Unido; Gary Koop, da University of Glasgow. 

Diversos comentarios e sugestoes proporcionados pelos revisores da quarta edigao trouxeram 
substanciais melhorias a esta edigao. Gostariamos de agradecer a: 


Valerie Bencivenga 

University of Texas —Austin 

Andrew Economopoulos 

Ursinus College 

Eric Eide 

Brigham Young University 

Gary Ferrier 

University of Arkansas — Fayetteville 

David Garman 

Tufts University 

David Harris 

Benedictine College 

Don Holley 

Boise State University 

George Jakubson 

Cornell University 
Bruce Johnson 
Centre College of Kentucky 
Duke Kao 

Syracuse University 


Gary Krueger 

Macalester College 

Subal Kumbhakar 

Binghamton University 

Tae-Hwy Lee 

University of California - Riverside 

Solaiman Miah 

West Virginia State University 

Fabio Milani 

University of California - Irvine 

Helen Naughton 

University of Oregon 

Solomon Smith 

Langston University 

Kay Strong 

Bowling Green State University 

Derek Tittle 

Georgia Institute of Technology 

Tiemen Woutersen 

Johns Hopkins University 


VII 



viii Agradecimentos 


Gostanamos de agradecer ainda aos estudantes e professores de todo o mundo que nao apenas 
utilizaram o livro, mas entraram em contato conosco sobre varios aspectos de seu conteudo. 

Pelo seu apoio nos bastidores da McGraw-Hill, agradecemos a Douglas Reiner, Noelle Fox e a 
Anne Hilbert. 

George F. Watson, o editor do texto que fez maravilhoso trabalho com um manuscrito longo e 
exigente. Devo muito a ele. 

Por fim, mas nao menos importante, o dr. Gujarati gostaria de agradecer a suas filhas Joan e 
Diane, por seu constante apoio e incentivo na prepara^ao desta e das edicoes anteriores. 

Damodar N. Gujarati 
Dawn C. Porter 


Prefacio 


Objetivos do livro 

A primeira ed^ao de Econometria bdsica foi publicada ha 30 anos. Ao longo desse perfodo, 
ocorreram avancos na teoria e na pratica da econometria. Em cada uma das edi§oes subsequentes, 
procurei incorporar os principais ava^os nesta disciplina. A quinta ed^ao manteve essa trad^ao. 

No entanto, o que nao mudou no decorrer desses anos foi minha firme conviccjao de que e possi- 
vel ensinar econometria de maneira intuitiva e informativa sem recorrer a algebra matricial, ao cal- 
culo ou a estatfstica em nfveis alem do elementar. Alguns itens sao inerentemente tecnicos. Nesses 
casos, os incluf no apendice apropriado ou indiquei fontes de referenda. Mesmo assim, procurei 
simplificar a parte tecnica para que o leitor possa desenvolver urn entendimento intuitivo. 

E uma surpresa agradavel a longevidade deste livro, bem como o fato de que e utilizado nao 
apenas por estudantes de economia e administra 9 ao mas por alunos e pesquisadores de varias outras 
disciplinas, como ciencias politicas, relafoes internacionais, agronomia e ciencias da saude. Os 
estudantes dessas areas verao que o estudo expandido de varios topicos e aplica 9 oes concretas e 
muito util. Nesta nova edi 9 ao dei ainda mais aten 9 ao para a relevancia e a propriedade dos dados 
reais usados no texto. Na verdade, acrescentei cerca de 15 exemplos ilustrativos e mais de 30 exer- 
cicios de final de capitulo. Alem disso, atualizei os dados de mais de 20 exemplos da edifao anterior 
e de mais de 20 exercfcios. 

Embora esteja na oitava decada de minha vida, nao perdi o amor pela econometria e continuo 
empenhando esftmjos para me manter atualizado nos ava^os desta disciplina. Para me auxiliar 
nesta empreitada e um prazer ter como coautor o dr. Dawn Porter, professor assistente de Estatfstica 
da Escola de Administra 9 ao Marshall da University of Southern California em Los Angeles. Ambos 
nos envolvemos profundamente na elabora 9 ao da quinta edi 9 ao de Econometria bdsica. 


Principals caracteristicas da quinta cdicao 

Antes de discutir mudan 9 as especificas nos diversos capitulos, e importante ressaltar as seguintes 
caracteristicas da nova edi 9 ao. 

1. Praticamente todos os dados usados nos exemplos ilustrativos foram atualizados. 

2. Foram acrescentados diversos exemplos. 

3. Em varios capitulos, incluimos exemplos finais estendidos que ilustram os diversos argumentos 
no texto. 

4. Incluiram-se telas de computador de varios exemplos. A maioria desses resultados baseiam-se nos 
pacotes estatfsticos EViews (versao 6) e STATA (versao 10), assim como MINITAB (versao 15). 

5. Diversos diagramas e graficos foram incluidos nos varios capitulos. 

6. Diversos exercfcios de bancos de dados foram introduzidos nos varios capitulos. 

7. Dados de tamanho reduzido foram incluidos. 

8. Em alguns capitulos, inserimos exercfcios de classe em que os estudantes sao encorajados a obter 
seus proprios dados e a implementar as varias tecnicas discutidas no livro. Algumas simula 9 oes 
Monte Carlo tambem foram inclufdas. 


IX 
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Mudan^as especificas da quinta edi^ao 

Algumas mudan 5 as especificas desta edi?ao: 

1. As hipoteses que embasam o modelo classico de regressao linear (MCRL) apresentadas no 
Capitulo 3 agora fazem uma distin 9 ao cuidadosa entre regressores fixos (variaveis ex- 
planatorias) e regressores aleatorios. Discutiremos a importancia dessa distinijao. 

2. O Apendice do Capitulo 6 discute as propriedades dos logaritmos, as transforma 9 oes Box-Cox e 
varias formulas de crescimento. 

3. O Capitulo 7 agora discute nao so o impacto marginal de um regressor linico sobre a variavel 
dependente, como tambem os impactos de mudan 9 as simultaneas de todas as variaveis ex- 
planatorias sobre a variavel dependente. Este capitulo tambem foi reorganizado utilizando-se a 
mesma estrutura das hipoteses do Capitulo 3. 

4. O Capitulo 11 apresenta uma compara 9 ao entre os varios testes de heterocedasticidade. 

5. Ha uma nova discussao do impacto de estruturas sobre a autocorrela 9 ao no Capitulo 12. 

6. Novos topicos foram incluidos no Capitulo 13: dados ausentes, termo de erro ndo normal e 
regressores estocdsticos ou aleatorios. 

7. Um modelo de regressao nao linear discutido no Capitulo 14 apresenta uma aplica 9 ao concreta 
da transforma 9 ao Box-Cox. 

8. O Capitulo 15 contem muitos exemplos novos que ilustram o uso dos modelos logit e probit em 
varios campos. 

9. O Capitulo 16 sobre modelos de regressao com dados em painel foi substancialmente revisto e 
ilustrado com varias aplica 9 oes. 

10. O Capitulo 17 agora examina extensamente o teste de causalidade de Sims e Granger. 

11. Series temporais estacionarias e nao estacionarias, bem como alguns dos problemas associados 
aos testes de estacionariedade, agora sao extensamente abordadas no Capitulo 21 

12. O capitulo 22 inclui uma discussao sobre por que eliminar as primeiras diferen 9 as de uma serie 
temporal com a finalidade de torna-la estacionaria pode nao ser uma estrategia apropriada em 
algumas situa 9 oes. 

Alem das mudan 9 as especificas, erros de conteiido e ortografia das ed^oes anteriores foram cor- 

rigidos e a discussao sobre diversos topicos em varios capitulos foi aprimorada. 


Organiza^ao e op^oes 

A extensa cobertura desta edi 9 ao propicia ao professor grande flexibilidade na escolha dos topicos 
mais adequados aos alunos. A seguir, algumas sugestoes para o uso do livro. 

Curso de um semestre para nao especialistas: Apendice A, Capitulos de 1 a 9 e uma visao geral 
dos Capitulos 10, lie 12 (omitindo todas as demonstra 9 oes). 

Curso de um semestre para estudantes de economia: Apendice A, Capitulos 1 a 13. 

Curso de dois semestres para estudantes de economia: Apendices A, B, C, Capitulos 1 a 22. Os 

Capitulos 14 e 16 podem ser opcionais. Alguns dos apendices tecnicos podem ser omitidos. 

Estudantes de mestrado e doutorado e pesquisadores: Este livro e um manual de referenda 
para os principals topicos da econometria. 
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Introdugao 


1.1 O que e econometria? 


Em uma interpretagao literal, econometria significa “medi 9 ao economica”. Embora a tried iqao 
seja uma parte importante da econometria, seu escopo e muito mais amplo, como mostram as se- 
guintes cita 9 oes: 

A econometria, resultado de determinada perspectiva sobre o papel da economia, consiste na aplicajao 
da estatfstica matematica a dados economicos para dar suporte empfrico aos modelos formulados pela 
economia matematica e obter resultados numericos. 1 

[...] a econometria pode ser definida como a analise quantitativa dos fenomenos economicos ocorridos 
com base no desenvolvimento paralelo da teoria e das observajoes e com o uso de metodos de inferen- 
cia adequados. 2 

A econometria pode ser definida como a ciencia social em que as ferramentas da teoria economica, da 
matematica e da inferencia estatfstica sao aplicadas a analise dos fenomenos economicos. 3 

A econometria diz respeito a determinajao empfrica das leis economicas. 4 

A arte do econometrista esta em encontrar o conjunto de hipoteses suficientemente especificas e realis- 
tas que lhe permitam tirar o melhor proveito dos dados de que dispoe. 5 

Os econometristas [...] sao um auxilio positivo na tentativa de dissipar a imagem publica negativa da 
economia (seja ela quantitativa ou nao) como assunto em que caixas vazias sao abertas supondo-se a 
existencia de abridores de lata para revelar conteudos que dez economistas interpretarao de 11 maneiras 
distintas. 6 

O rnetodo da pesquisa econometrica visa, essencialmente, a conjugaqao da teoria economica com me- 
dijoes concretas, usando a teoria e a tecnica da inferencia estatfstica como uma ponte. 7 


1 TINTNER, Gerhard. Methodology of mathematical economics and econometrics. Chicago: The University of Chica¬ 
go Press, 1968. p. 74. 

2 SAMUELSON, P. A.; KOOPMANS, T. C.; STONE, J. R. N. Report of the evaluative committee for econometrica. Econome¬ 
trica. Abr. 1954, v. 22, n. 2, p. 141-146. 

3 COLDBERCER, Arthur S. Econometric theory. Nova York: John Wiley & Sons, 1964. p. 1. 

4 THEIL, H. Principles of econometrics. Nova York: John Wiley & Sons, 1971. p. 1. 

5 MALINVAUD, E. Statistical methods of econometrics. Chicago: Rand McNally, 1966. p. 514. 

6 DARNELL, Adrian C.; EVANS, J. Lynne. The limits of econometrics. Rants, Ingiaterra: Edward Elgar Publishing, 
1990. p. 54. 

7 HAAVELMO, T. "The probability approach in econometrics". Suplemento da Econometrica. 1944. v. 12, prefacio 
p. iii. 


25 




26 Econometria Basica 


1.2 Por que uma disciplina separada? 

Como as definigoes apresentadas sugerem, a econometria e urn amalgama de teoria economica, 
economia matematica, estatfstica economica e estatfstica matematica. Contudo, o assunto merece ser 
estudado de modo independente pelas seguintes razoes. 

A teoria economica faz declaragoes ou hipoteses principalmente de natureza qualitativa. Por exem- 
plo, a teoria microeconomica afirma que, tudo o mais permanecendo igual, uma redugao no prego 
de uma mercadoria deve resultar no aumento da quantidade demandada por esta mercadoria. Por- 
tanto, a teoria economica postula uma relagao negativa ou inversa entre o prego e a quantidade de¬ 
mandada de uma mercadoria. Mas a teoria em si nao oferece nenhuma medida quantitativa da 
relagao entre as duas variaveis; ela nao nos informa quanto a quantidade aumentara ou diminuira em 
consequencia de determinada variagao no prego da mercadoria. Cabe ao econometrista oferecer es- 
sas estimativas numericas. Em outras palavras, o econometrista proporciona conteudo pratico a maior 
parte da teoria economica. 

A principal preocupagao da economia matematica e expressar a teoria economica de forma ma¬ 
tematica (equagoes) sem levar em conta se a teoria pode ser medida ou verificada empiricamente. A 
econometria, como ja mencionado, esta principalmente interessada na verificagao da teoria economica. 
Conforme veremos, o econometrista frequentemente usa as equagoes matematicas formuladas pelo 
economista matematico, mas as aplica de forma que possam ser testadas na pratica. E essa conversao 
de equagoes matematicas em equagoes econometricas requer bastante engenhosidade e habilidade. 

A estatfstica economica busca principalmente a coleta, processamento e apresentagao dos dados 
economicos na forma de graficos e tabelas. Essa e a tarefa do estatistico economico. E ele o principal 
responsavel por coletar dados sobre o produto nacional bruto (PNB), o emprego, o desemprego, os 
pregos etc. As informagoes coletadas constituem os dados brutos do trabalho econometrico. Mas o tra- 
balho do estatfstico economico nao vai alem disso; seu foco nao e usar os dados para testar as teorias 
economicas. E claro, se fosse, ele se tornaria um econometrista. 

Embora a estatfstica matematica proporcione muitas das ferramentas usadas em sua atividade, os 
econometristas em geral precisam de metodos especiais em vista da natureza especifica da maioria dos 
dados economicos, isto e, por serem dados que nao foram gerados por meio de experimentos contro- 
lados. O econometrista, como o meteorologista, depende em geral de dados que nao podem ser 
controlados diretamente. Como Spanos observa corretamente: 

Na econometria, quem modela muitas vezes se depara com dados provenientes de observagoes em 
oposigao aos dados experimentais. Isso tem duas implicagoes importantes para a modelagem empirica 
na econometria. Primeiro, quem modela deve dominar habilidades muito diferentes das necessarias 
a analise de dados experimentais [...]. Segundo, a diferenga entre quem coleta dados e quem os analisa 
exige que quem modela esteja profundamente familiarizado com a natureza e a estrutura dos dados 
em questao . * * * * 8 


1.3 A metodologia econometrica 

Como fazem os econometristas para analisar um problema economico? Qual metodologia utili- 

zam? Embora existam varias escolas de pensamento sobre metodologia econometrica, aqui apresen- 

tamos a tradicional ou classica, que ainda domina a pesquisa na economia e em outras ciencias sociais 

e comportamentais . 9 


8 SPANOS, Aris. Probability. Theory and statistical inference: econometric modfling with observational data. Reino 
Unido: Cambridge University Press, 1999. p. 21. 

9 Para uma discussao esclarecedora, embora avangada, do metodo econometrico, veja HENDRY, David F. Dynamic 
econometrics. Nova York: Oxford University Press, 1995. Veja tambem SPANOS, Aris op. cit. 
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Em termos gerais, a metodologia econometrica traditional segue os seguintes passos: 

1. Exposigao da teoria ou hipotese. 

2. Especificagao do modelo matematico da teoria. 

3. Especificagao do modelo estatlstico on econometrico. 

4. Obtengao dos dados. 

5. Estimagao dos parametros do modelo econometrico. 

6. Teste de hipoteses. 

7. Projegao ou previsao. 

8. Uso do modelo para fins de controle ou de politica. 

Para ilustrarmos esses passos, vejamos a conhecida teoria do consumo keynesiana. 

1. Exposigao da teoria ou hipotese 

Keynes afirmou: 

A lei psicologica fundamental [...] e que os homens [as mulheres] estao dispostos, como regra e em 
media, a aumentar seu consumo conforme sua renda aumenta, mas nao na mesma proporgao que o au- 
mento na renda . 10 

Em resumo, Keynes postulava que a propensao marginal a consumir (PMC), a taxa de varia- 
gao do consumo por variagao de uma unidade (digamos, um dolar) de renda, e maior que zero, mas 
menor que 1. 

2. Especificagao do modelo matematico da teoria 

Embora Keynes postulasse uma relagao positiva entre consumo e renda, ele nao especificou a 
forma exata da relagao funcional entre as duas variaveis. Para simplificar, um economista mate¬ 
matico poderia sugerir a seguinte forma para a fungao de consumo keynesiana: 

Y=p l + /3 2 X 0 < yd 2 < 1 (1.3.1) 

em que Y — despesas de consumo e X — renda, e /3| e fi 2 , conhecidos como os parametros do 
modelo, sao, respectivamente, o intercepto e o coeficiente angular. 

O coeficiente angular, /3 2 , mede a PMC. A Figura 1.1 mostra a representagao geometrica da 
Equagao (1.3.1). Essa equagao, que especifica que o consumo se relaciona linearmente a renda, e 
um exemplo de modelo matematico da relagao entre consumo e renda e e conhecida como fungao 
consumo em economia. O modelo e apenas um conjunto de equagoes matematicas. Se o modelo 
tem apenas uma equagao, como no apresentado, denomina-se modelo uniequacional, enquanto 
se tiver mais de uma equagao sera denominado modelo de multiplas equagoes (que veremos 
mais adiante). 

Na Equagao (1.3.1), a variavel que aparece do lado esquerdo do sinal de igualdade e chamada 
de variavel dependente e a(s) variavel(eis) do lado direito e(sao) chamada(s) de variavel(eis) 
independente(s) ou explanatoria(s). Assim, na fungao consumo keynesiana, o consumo (despesa) e a 
variavel dependente e a renda e a variavel explanatoria. 


10 KEYNES, John Maynard. The general theory of employment, interest and money. Nova York: Harcourt Brace Jova- 
novich, 1936. p. 96. 
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FIGURA 1.1 

Funqao consumo 
keynesiana. 


Y 



3. Especificagao do modelo estatfstico ou econometrico 

O modelo puramente matematico da funqao consumo apresentado na Equaqao (1.3.1) e de inte- 
resse limitado para o econometrista, pois supoe que existe uma relaqao exata ou deterministica 
entre o consumo e a renda. Mas as relaqoes entre variaveis economicas sao, em geral, inexatas. 
Portanto, se coletarmos dados sobre despesas de consumo e renda disponfvel (a renda depois de 
descontados os impostos) de uma amostragem de, digamos, 500 famflias americanas e traqarmos um 
grafico em que o eixo vertical representa as despesas de consumo e o eixo horizontal, a renda dispo- 
nfvel, nao devemos esperar que as 500 observaqoes se situem exatamente na reta dada pela Equaqao 
(1.3.1). Isso porque, alem da renda, outras variaveis afetam as despesas de consumo. O tamanho da 
familia, a idade de seus integrantes, a religiao etc., por exemplo, provavelmente exercem certa influ- 
encia sobre o consumo. 

Para levar em conta as relaqoes inexatas entre as variaveis economicas, o econometrista 
deve modificar a funqao consumo deterministica da Equaqao (1.3.1) do seguinte modo: 

Y= A + p 2 X + u (1.3.2) 

em que u, conhecido como disturbio, ou termo de erro, e uma variavel aleatoria (estocastica) que 
tem propriedades probabilisticas conhecidas. O termo de erro u pode representar bem todos esses fa- 
tores que afetam o consumo, mas que nao sao levados em conta explicitamente. 

A Equaqao (1.3.2) e um exemplo de modelo econometrico. Mais tecnicamente, e um exemplo de 
modelo de regressao linear, que e o principal tema deste livro. A fun 5 ao consumo econometrica 
baseia-se na hipotese de que a variavel dependente Y (o consumo) se relaciona linearmente com a 
variavel cxplanatoria X (a renda), mas que a rela 5 ao entre ambas nao e exata: esta sujeita a varia§des 
individuals. 

O modelo econometrico da fun?ao consumo pode ser representado pelo grafico da Figura 1.2. 

4. Obten^ao dos dados 

Para estimarmos o modelo econometrico da Equaqao (1.3.2), isto e, para obtermos os va- 
lores numericos de e /3 2 , precisamos de dados. Embora no proximo capitulo falaremos 
mais sobre a importancia crltica dos dados para a analise economica, por enquanto vamos 
examinar os dados apresentados na Tabela 1.1, que se refere a economia dos Estados Unidos 
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FIGURA 1.2 

Modelo econometrico 
da fungao consumo 
keynesiana. 


Y 



no periodo 1960-2005. Na tabela, a variavel Y corresponde as despesas de consumo pessoal 
(DCP) agregada (isto e, para a economia como um todo) e a variavel X ao produto intemo 
bruto (PIB), um indicador de renda agregada, ambas medidas em termos de bilhdes de dolares 
de 2000. Portanto, os dados sao apresentados em termos “reais”, isto e, foram medidos a pre- 
90 s constantes (de 2000). Os dados estao representados graficamente na Figura 1.3 (compare 
com a Figura 1.2). Por enquanto, deixemos de lado a linha traqada no grafico. 

5. Estima^ao dos parametros do modelo econometrico 

Agora que temos os dados, nossa proxima tarefa e estimar os parametros da fungao consu¬ 
mo. A estimativa numerica dos parametros fornece conteudo empirico a fun 9 ao consumo. O 
mecanismo para estimar os parametros sera examinado no Capftulo 3. Por enquanto, note que 
a tecnica estatfstica da analise de regressao e a principal ferramenta para obter as estimativas. 
Aplicando essa tecnica aos dados da Tabela 1.1, obtemos as seguintes estimativas de e /i 2 , 
especificamente, — 299,5913 e 0,7218. Portanto, a fun 9 ao consumo estimada e: 

Y t = —299,5913 + 0,7218X, (1.3.3) 

O acento circunflexo em cima do Y indica que se trata de uma estimativa . 11 A Figura 1.3 mostra a 
fun 9 ao consumo estimada (isto e, a linha de regressao). 

Como indica a Figura 1.3, a linha de regressao ajusta-se bem aos dados, no sentido de que 
os pontos no grafico que representam os dados ficam muito proximos da linha de regressao. A 
figura nos mostra que, para o periodo 1960-2005, o coeficiente angular (a PMC) era de quase 
0,72, indicando que, no periodo amostrado, um aumento de um dolar na renda real levava, em 
media , a um aumento de cerca de 72 centavos nas despesas reais de consumo . 12 Dizemos em 
media porque a relaqao entre consumo e renda e inexata; como fica claro na Figura 1.3, nem 
todos os pontos dos dados estao exatamente sobre a linha de regressao. Em termos simples, 
podemos dizer que, de acordo com nossos dados, as despesas medias de consumo aumentam 
cerca de 70 centavos a cada aumento real de um dolar na renda real. 


11 O uso de um acento circunflexo sobre uma variavel ou parametro indica, por convengao, que se trata de um 
valor estimado. 

12 Por enquanto, nao se preocupe sobre como esses valores foram obtidos. Como mostraremos no Capftulo 3, 
essas estimativas foram obtidas atraves do metodo estatfstico dos mfnimos quadrados. Tambem, por enquan¬ 
to, nao se preocupe com o valor negativo do intercepto. 
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TABELA 1.1 

Despesas de consumo 
pessoal (F) e produto 
interno bruto (X), 
1960-2005 em bilhoes 
de dolares de 2000 

Fonte: Economics Report of 
the President, 2007, Tabela 
B-2, p, 230. 


Ano 

DCP(F) 

PIB(X) 

1960 

1597,4 

2501,8 

1961 

1630,3 

2560,0 

1962 

1711,1 

2715,2 

1963 

1781,6 

2834,0 

1964 

1888,4 

2998,6 

1965 

2007,7 

3191,1 

1966 

2121,8 

3399,1 

1967 

2185,0 

3484,6 

1968 

2310,5 

3652,7 

1969 

2396,4 

3765,4 

1970 

2451,9 

3771,9 

1971 

2545,5 

3898,6 

1972 

2701,3 

4105,0 

1973 

2833,8 

4341,5 

1974 

2812,3 

4319,6 

1975 

2876,9 

4311,2 

1976 

3035,5 

4540,9 

1977 

3164,1 

4750,5 

1978 

3303,1 

5015,0 

1979 

3383,4 

5173,4 

1980 

3374,1 

5161,7 

1981 

3422,2 

5291,7 

1982 

3470,3 

5189,3 

1983 

3668,6 

5423,8 

1984 

3863,3 

5813,6 

1985 

4064,0 

6053,7 

1986 

4228,9 

6263,6 

1987 

4369,8 

6475,1 

1988 

4546,9 

6742,7 

1989 

4675,0 

6981,4 

1990 

4770,3 

7112,5 

1991 

4778,4 

7100,5 

1992 

4934,8 

7336,6 

1993 

5099,8 

7532,7 

1994 

5290,7 

7835,5 

1995 

5433,5 

8031,7 

1996 

5619,4 

8328,9 

1997 

5831,8 

8703,5 

1998 

6125,8 

9066,9 

1999 

6438,6 

9470,3 

2000 

6739,4 

9817,0 

2001 

6910,4 

9890,7 

2002 

7099,3 

10048,8 

2003 

7295,3 

10301,0 

2004 

7577,1 

10703,5 

2005 

7841,2 

11048,6 




Introdugao 31 


FIGURA 1.3 
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6. Teste de hipoteses 

Considerando que o modelo ajustado seja uma aproxima 5 ao razoavelmente boa da realidade, e 
preciso desenvolver criterios adequados para verificar se as estimativas obtidas, digamos, na Equa- 
?ao (1.3.3) estao de acordo com as expectativas da teoria que esta sendo testada. Segundo economis- 
tas “positivos” como Milton Friedman, uma teoria ou hipotese que nao for verificavel com evidencias 
empiricas pode nao ser admissivel como parte de uma pesquisa cientifica . 13 

Conforme observado anteriormente, Keynes esperava que a PMC fosse positiva, mas menor que 
1. Em nosso exemplo, a PMC e de cerca de 0,72. Entretanto, antes de aceitarmos esse valor como 
uma confirmagao da teoria do consumo keynesiana, precisamos nos perguntar se essa estimativa esta 
suficientemente abaixo da unidade para nos convencer de que nao e um resultado devido ao acaso 
ou uma peculiaridade dos dados que utilizamos. Em outras palavras, 0,72 e estatisticamente menor 
que 7? Se for, sera um respaldo para a teoria de Keynes. 

Tal confirmapao ou refuta^ao de teorias economicas com base em evidencias amostrais se alicer- 
5 a em um ramo da teoria estatfstica conhecido como inferencia estatfstica (teste de hipoteses). Ao 
longo do livro, veremos como esse processo e conduzido na pratica. 

7. Proje^ao ou previsao 

Se o modelo escolhido nao refutar a hipotese ou teoria considerada, podemos utiliza-lo para 
prever o(s) valor(es) futuro(s) da variavel previsao Y, ou variavel dependente, com base no(s) 
valor(es) futuro(s) conhecidos ou esperados da variavel previsora X, ou variavel explanatoria. 


13 Veja FRIEDMAN, Milton. "The methodology of positive economics." Essays in Positive Economcs. Chicago: University 
of Chicago Press, 1953. 
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Para fins de ilustraqao, suponha que desejemos prever as despesas medias de consumo para 
2006. O valor do P1B nesse ano foi de $ 11319,4 bilhao. 14 Colocando o valor do P1B no lado direito 
da Equa^ao (1.3.3), obtemos: 

1*2006 = -299,5913 + 0,7218(11319,4) 3 4) 

= 7870,7516 ; 

ou cerca de $7,870 bilhoes. Assim, dado o valor do P1B, as despesas de consumo medias previstas 
sao de cerca de $7,870 bilhoes. O valor dessas despesas efetivamente registrado em 2006 foi de 
$ 8.044 bilhoes. Portanto, o modelo estimado (1.3.3) subestimou as despesas de consumo reais em 
cerca de $ 174 bilhoes. Podemos dizer que o erro de previsao e de cerca $174 bilhoes, que e aproxi- 
madamente de 1,5% do valor do P1B registrado em 2006. Quando examinarmos mais a fundo o mo¬ 
delo de regressao linear nos proximos capitulos, tentaremos verificar se um erro desse tipo e “pequeno” 
ou “grande”. Mas o importante agora e observar que esses erros de previsao sao inevitaveis, dada a 
natureza estatfstica de nossa analise. 

Ha outro uso para o modelo estimado na Equaqao (1.3.3). Suponha que o presidente decida pro- 
por uma redu 9 ao na alfquota do imposto de renda. Qual seria o efeito dessa polftica sobre a renda e, 
por conseguinte, sobre as despesas de consumo e, por fim, sobre o emprego? 

Suponha que, como resultado da mudanca proposta, as despesas com investimento aumentem. 
Qual seria o efeito sobre a economia? Como mostra a teoria macroeconomica, a mudanqa na renda 
que se segue, digamos, a varia 9 ao de um dolar nas despesas com investimento e dada pelo multipli- 
cador da renda M, que e definido como: 


M 


I 

1 - PMC 


(1.3.5) 


Se utilizarmos a PMC de 0,72 obtida na Equaqao (1.3.3), esse multiplicador sera de cerca de 
M = 3,57. Isto e, um aumento (redu 9 ao) de um dolar no investimento levara por fim a um aumento 
(redu 9 ao) de mais de tres vezes na renda; observe que o multiplicador demora a produzir seu efeito. 

Um valor crftico nesses calculos e a PMC, pois o multiplicador depende dela. E essa estimativa 
da PMC pode ser obtida por meio de modelos de regressao como o da Equa 9 ao (1.3.3). As estimati- 
vas quantitativas da PMC proporcionam informa 9 oes valiosas para a formula 9 ao da polftica econo¬ 
mica. Conhecendo a PMC, podemos prever o curso future da renda, das despesas de consumo e do 
emprego apos uma alteraqao da politica fiscal do governo. 

8. Uso do modelo para fins de controle ou de polftica 

Suponha que tenhamos estimada a fun 9 ao consumo da Equaqao (1.3.3). Suponha, ainda, que o 
governo acredite que as despesas de consumo de cerca de $ 8.750 bilhoes (em dolares de 2000) 
manterao a taxa de desemprego em seu nfvel atual de cerca de 4,2% (no infcio de 2006) . Que nfvel 
de renda garantira o montante almejado (meta) de despesas de consumo? 

Se os resultados da regressao da Equaqao (1.3.3) parecem razoaveis, um calculo aritmetico sim¬ 
ples mostrara que: 


8.750 = -299,5913 + 0,7218 (PIB 2006 ) (1.3.6) 

o que da aproximadamente X — 1.2537. Ou seja, um nivel de renda de cerca de $ 1.2537 bilhoes, dada 
uma PMC de cerca de 0,72, gerara uma despesa de cerca de $ 8.750bilhoes. 


14 Os dados do DCP e do PIB para 2006 estavam disponfveis, mas os deixamos de lado propositadamente para 
ilustrar o topico examinado nesta segao. Como veremos em capftulos subsequentes, e uma boa ideia guardar 
uma parte dos dados para verificar como o modelo ajustado preve as observagoes que estao fora da amostra. 
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Como esses calculos sugerem, um modelo estimado pode ser usado para fins de controle ou de 
formulapao de politicas. Com uma combinapao apropriada de politicas fiscais e monetarias, o gover- 
no pode manejar a variavel de controle X para gerar o nfvel desejado da variavel meta Y. 

A Figura 1.4 resume a anatomia da modelagem econometrica classica. 

Escolha do modelo 

Quando um orgao governamental (por exemplo, o Departamento de Comercio dos Estados Uni- 
dos) coleta dados como os apresentados na Tabela 1.1, nao tem necessariamente uma teoria econo¬ 
mica qualquer em mente. Como sabemos entao que os dados realmente confirmam a teoria do 
consumo keynesiana? Seria porque a fimpao consumo keynesiana (a linha de regressao) da Figura 
1.3 esta extremamente proxima dos dados disponiveis? E possivel que outro modelo (teoria) do con¬ 
sumo se ajuste igualmente bem aos dados? Por exemplo, Milton Friedman desenvolveu um modelo 
de consumo, chamado hipotese da renda permanente. 15 Robert Hall tambem formulou um mode¬ 
lo de consumo, conhecido como hipotese da renda permanente no ciclo de vida. 16 Algum desses 
modelos, ou ambos, tambem poderiam servir para os da Tabela 1.1? 

Em resumo, a duvida com que o pesquisador se depara na pratica e como escolher entre as dife- 
rentes hipoteses ou modelos para um dado fenomeno, como a relapao consumo-renda. Como Miller 
argumenta: 

Nenhum encontro com os dados e uma etapa no sentido de confirmapao autentica a menos que a hi¬ 
potese lide melhor com os dados que algum rival natural [...]. O que fortalece uma hipotese, nesse 
caso, e a vitoria que, ao mesmo tempo, e a derrota para outra hipotese plausfvel. 17 

Como, entao, escolher entre os diversos modelos ou hipoteses concorrentes? Vale a pena ter em 
mente o conselho de Clive Granger: 18 


FIGURA 1.4 

Anatomia da 

modelagem 

econometrica. 



15 FRIEDMAN, Milton.A theory of consumption function. Princeton: N. J.: Princeton University Press, 1957. 

16 HALL, R. "Stochastic implications of the life cycle permanent income hypothesis: theory and evidence." journal 
of Political Economy, 1978. v. 86, p. 971 -987. 

17 MILLER, R. W. Fact and method: Explanation, confirmation, and reality in the natural and social sciences. Prin¬ 
ceton, N.J.: Princetor University Press, 1978. p. 176. 

18 GRANGER, Clive W. J. Empirical modeling in economics. Reino Unido: Cambridge University Press, 1999. p. 58. 
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Gostaria de sugerir que, no futuro, voce faga as seguintes perguntas quando lhe apresentarem uma nova 

teoria ou modelo empfrico: 

(i) Qual o proposito disto? Para que decisao economica contribuira? e; 

(ii) Existe alguma prova que me permita avaliar sua qualidade em comparagao com teorias ou modelos 
alternativos? 

Penso que, se for dada a devida atengao a essas perguntas, a pesquisa e a discussao economicas 

serao fortalecidas. 

A medida que avangarmos no livro, encontraremos varias hipoteses que concorrem para explicar 
os varios fenomenos economicos. Por exemplo, os estudantes de economia conhecem bem o concei- 
to da fungao de produgao, que e basicamente uma relagao entre produto e insumos (capital e traba- 
lho). Na literatura, duas das mais conhecidas sao as fungoes Cobb-Douglas e a da elasticidade 
de substituigao constante. Precisaremos descobrir, em virtude dos dados de produgao e de insu¬ 
mos, se alguma delas, reflete melhor os dados. 

O metodo econometrico classico de oito etapas apresentado anteriormente e neutro no sentido de 
que pode ser usado para testar qualquer uma dessas hipoteses rivais. 

E possivel formular uma metodologia que seja suficientemente abrangente para incluir hipoteses 
concorrentes? Esse e um topico complexo e controverso que sera discutido no Capitulo 13, depois 
que tivermos adquirido conhecimentos teoricos suficientes. 


1.4 Tipos de econometria 

Como sugere a estrutura classificatoria da Figura 1.5, a econometria pode ser divida em duas 
categorias amplas: econometria teorica e econometria aplicada. Em cada categoria podemos 
abordar a disciplina segundo as tradigoes classica e bayesiana. Neste livro, damos enfase a clas- 
sica. Quanto a abordagem bayesiana, o leitor pode consultar as referencias indicadas no final do 
capitulo. 

A econometria teorica trata do desenvolvimento de metodos adequados para medir as rela- 
goes economicas especificadas nos modelos econometricos. Sob esse aspecto, a econometria 
depende fortemente da estatistica matematica. Por exemplo, um dos metodos mais usado neste 
livro e o dos minimos quadrados. A econometria teorica deve deixar claras as hipoteses deste 
metodo, suas propriedades e o que acontece com elas quando uma ou mais hipoteses do metodo 
nao sao atendidas. 

Na econometria aplicada, utilizamos as ferramentas da econometria teorica para estudar um ou 
mais campos especiais da economia e dos negocios, como a fungao de produgao, a fungao investi- 
mento, as fungoes de oferta e de demanda, a teoria do portfolio etc. 

Este livro trata, em grande parte, a formulagao dos metodos econometricos, suas hipoteses, 
usos, limitagoes. Esses metodos sao ilustrados com exemplos de varias areas da economia e dos 
negocios. No entanto, este nao e um livro de econometria aplicada, no sentido de se aprofundar 
particularmente em quaisquer dos campos da aplicagao economica. Essa tarefa cabe as obras es- 
critas especificamente com esse fim. Ao final do livro, ofereceremos algumas referencias biblio- 
graficas. 

FIGURA 1.5 

Categorias da 
econometria. 
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1.5 Pre-requisitos matematicos e estatfsticos 

Embora este livro seja escrito em um nfvel elementar, o autor pressupoe que o leitor este- 
ja familiarizado com os conceitos basicos da estimagao estatistica e do teste de hipoteses. O 
Apendice A oferece uma visao geral e nao tecnica dos conceitos estatfsticos basicos emprega- 
dos aqui para aqueles que desejam reciclar seus conhecimentos. No que se refere a matematica, 
e desejavel ter uma nogao sobre calculo diferencial, embora nao seja essencial. Apesar de a 
maioria dos livros de econometria voltados a pos-graduagao utilizar amplamente a algebra 
matricial, quero deixar claro que ela nao e necessaria para tirar proveito deste livro. Estou 
completamente convencido de que as ideias fundamentais da econometria podem ser trans- 
mitidas sem recorrer a algebra matricial. No entanto, para os estudantes mais inclinados a matematica, 
o Apendice C apresenta um resumo da teoria basica da regressao em notagao matricial e o Apendice B 
oferece um resumo dos principals resultados da algebra matricial. 


1.6 O papel do computador 

A analise de regressao, a principal ferramenta da econometria, e impensavel nos dias de hoje sem 
o computador e o acesso a alguns softwares estatfsticos ou pacotes estatfsticos. (Acreditem em mim, 
sou da geragao criada com a regua de calculo!) Felizmente, varios pacotes excelentes para regres- 
soes estao disponfveis no mercado, tanto para computadores de grande porte quanto para microcom- 
putadores, e a lista cresce a cada dia. Softwares como ET, LIMDEP, SHAZAM, MICRO TSP, 
MINITAB, EVIEWS, SAS, SPSS, STATA, Microfit, PcGive e BMD atendem a maioria das tec- 
nicas e testes econometricos examinados neste livro. 

Ao longo do livro, o leitor sera convidado vez por outra a conduzir experimentos Monte Carlo 
com auxilio de um ou mais pacotes estatisticos. Os experimentos Monte Carlo sao “divertidos” e 
permitirao ao leitor apreciar as propriedades de varios metodos estatisticos utilizados aqui. Os deta- 
lhes dos experimentos Monte Carlo serao discutidos no momento apropriado. 


1.7 Sugestoes para leituras complementares 

O tema metodologia econometrica e vasto e controverso. Para os interessados, sugiro os livros 
a seguir: 

MARCHI, Neil de; GILBERT, Christopher. (Eds.). History and methodology of econometrics. Nova 
York: Oxford University Press, 1989. Esta coletanea de textos discute alguns trabalhos pioneiros em 
metodologia econometrica e examina extensamente a abordagem britanica da econometria e sua 
relagao com series temporais, ou seja, dados coletados ao longo do tempo. 

CHAREMZA, Wojciech W.; DEADMAN, Derek F. New directions in econometric practice: gen¬ 
eral to specific modelling, cointegration and vector autogression. 2. ed. Hants, lnglaterra: Edward Elgar 
Publishing Ltd., 1997. Os autores criticam a abordagem tradicional da econometria e apresentam 
uma exposigao detalhada das novas abordagens ao metodo econometrico. 

DARNELL, Adrian C.; EVANS, J. Lynne. The limits of econometrics. Hants, lnglaterra: Edward 
Elgar Publishers Ltd., 1990. Este livro oferece um exame bastante equilibrado das varias abordagens 
metodologicas econometricas, com uma fidelidade renovada ao metodo tradicional. 

MORGAN, Mary S. The history of econometric ideas. Nova York: Cambridge University Press, 1990. A 
autora oferece uma excelente perspectiva historica da teoria e da pratica econometricas, com um 
exame profundo das contribuigoes iniciais de Haavelmo (ganhador do Nobel de Economia de 1990) 
a econometria. No mesmo espirito, o livro de David F. Hendry e Mary S. Morgan, The foundation of 
econometric analysis , Reino Unido: Cambridge University Press, 1995, refine uma selegao de tex¬ 
tos seminais para mostrar a evolugao das ideias econometricas ao longo do tempo. 
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COLANDER, David; BRENNER, Reuven. (Eds.). Educating economists. Ann Arbor, Michigan: 
University of Michigan Press, 1992. O livro apresenta uma visao critica, as vezes agnostica, do 
ensino e da pratica economicos. 

Para os interessados em estatistica e econometria bayesianas, os seguintes livros sao muito 
uteis: DEY, John H. Data in doubt. Inglaterra: Basil Blackwell Ltd., Oxford University Press, 1985; 
Peter, M. LEE. Bayesian statistics: an introduction. Inglaterra: Oxford University Press, 1989; e POR1ER, 
Dale J. Intermediate statistics and econometrics: a comparative approach. Cambridge, Massachusetts: 
MIT Press, 1995. ZELLER, Arnold. An introduction to bayesian inference in econometrics. Nova York: 
John Wiley & Sons, 1971, este e um livro de referenda avanpado. Outro livro de referenda avanpado e 
Palgrave handbook of econometrics: volume 1: econometric theory , editado por Terence C. Mills 
e Kerry Patterson, Nova York: Palgrave Macmillan, 2007. 


Parte 


Modelos de regressao 
com equayao unica 



A Parte I do livro apresenta modelos de regressao com equagao unica. Nesses modelos, uma 
variavel, chamada variavel dependente, e expressa como fungao linear de uma ou mais variaveis, de- 
nominadas variaveis explanatorias. Em tais modelos, supoe-se implicitamente que as relagdes causais, 
se existirem, entre a variavel dependente e as explanatorias ocorrem apenas em uma diregao, especi- 
ficamente, das variaveis explanatorias para a dependente. 

No Capftulo 1, discutimos a interpretagao historica, assim como a modema, do termo regressao e 
ilustramos a diferenga entre elas com varios exemplos da economia e de outros campos. 

No Capftulo 2, apresentamos alguns conceitos fundamentais da analise de regressao, com auxflio de 
um modelo de regressao linear de duas variaveis, um modelo em que a variavel dependente e expres¬ 
sa como fungao linear de uma unica variavel explanatoria. 

No Capftulo 3, continuamos abordando o modelo de duas variaveis e apresentamos o que e co- 
nhecido como o modelo cldssico de regressao linear, um modelo que adota varias hipoteses simplificadoras. 
Com essas premissas, expomos o metodo dos mlnimos quadrados ordinarios (MQO) para estimar os para- 
metros do modelo de regressao com duas variaveis. A aplicagao do metodo dos MQO e simples e tem 
algumas propriedades estatfsticas muito desejaveis. 

No Capftulo 4, apresentamos o modelo de regressao linear classico normal (com duas variaveis), um 
modelo que pressupoe que a variavel dependente estocastica siga a distribuigao de probabilidade 
normal. Desse modo, os estimadores de mfnimos quadrados ordinarios obtidos no Capftulo 3 adqui- 
rem algumas propriedades estatfsticas mais fortes do que o modelo de regressao linear classico nao 
normal — propriedades que nos permitem realizar a inferencia estatistica, isto e, testar hipoteses. 

O Capitulo 5 e dedicado ao topico do teste de hipoteses. Tentamos verificar se os coeficientes de 
regressao estimados sao compativeis com as hipoteses feitas em relagao ao valor desses coeficientes, 
sendo que os valores hipoteticos sao sugeridos pela teoria e/ou por trabalhos empfricos anteriores. 

O Capitulo 6 aborda algumas extensoes do modelo de regressao com duas variaveis. Em particular, 
discute topicos como: (1) regressao que passa pela origem; (2) escalas e unidades de medidas; e (3) 
formas funcionais dos modelos de regressao tais como log-log, semilog e modelos recfprocos. 

No Capftulo 7, consideramos o modelo de regressao multipla em que ha mais de uma variavel ex¬ 
planatoria e mostramos como o metodo dos mfnimos quadrados ordinarios pode ser ampliado para 
estimar os parametros de tais modelos. 

No Capftulo 8, estendemos os conceitos apresentados no Capftulo 5 ao modelo de regressao mul¬ 
tipla e destacamos algumas das complicagoes que surgem com a introdugao de diversas variaveis ex¬ 
planatorias. 

O Capitulo 9, sobre variaveis explanatorias binarias {dummy) ou qualitativas, conclui a primeira 
parte do livro. O capitulo ressalta que nem todas as variaveis explanatorias precisam ser quantitativas 
(isto e, ter escalas proporcionais). Variaveis como genero, raga, religiao, nacionalidade e regiao de re- 
sidencia nao podem ser prontamente quantificadas, contudo desempenham um papel importante para 
explicar varios fenomenos economicos. 



Capitulo 

A natureza da 
analise de regressao 

Conforme mencionado na Introduce), a regressao e a principal ferramenta da econometria e nes- 
te capitulo examinaremos sucintamente sua natureza. 



1.1 Origem historica do terino regressao 

O termo regressao foi criado por Francis Galton. Em um artigo famoso, Galton verificou que, 
embora existisse uma tendencia de que pais altos tivessem filhos altos e pais baixos tivessem filhos 
baixos, a estatura media das crian£as nascidas de pais com uma dada altura tendia a mover-se ou 
"regredir" a altura media da popula£ao como um todo. 1 Em outras palavras, a altura dos filhos de 
pais mais altos ou mais baixos que o padrao tende a mover-se no sentido da altura media da popu- 
larjao. A lei da regressao universal de Galton foi confirmada por seu amigo Karl Pearson, que cole- 
tou mais de mil registros de altura de membros de grupos familiares. 2 Ele constatou que a altura 
media dos filhos de um grupo de pais altos era menor do que a de seus pais e que a altura media de 
um grupo de filhos de pais baixos era maior do que a de seus pais; portanto, filhos de pais altos e 
baixos "regrediam" igualmente a altura media de todos os homens. Nas palavras de Galton, isso era 
uma "regressao a mediocridade". 


1.2 A interpreta^ao moderna da regressao 


Contudo, a interpreta 5 ao modema da regressao e bastante diferente. De modo geral, podemos dizer: 

A analise de regressao diz respeito ao estudo da dependencia de uma variavel, a varidvel dependen- 
te, em relajao a uma ou mais variaveis, as varidveis explanatorias, visando estimar e/ou prever o 
valor medio (da popula?ao) da primeira em termos dos valores conhecidos ou fixados (em amostra- 
gens repeddas) das segundas. 

A importancia desta visao da analise de regressao ficara mais clara a medida que avan^armos, mas 
alguns exemplos simples podem esclarecer o conceito basico. 

Exemplos 

1. Voltemos a lei da regressao universal de Galton. Ele estava interessado em descobrir por que 
havia estabilidade na distribu^ao de alturas em uma popula£ao. Mas, na visao moderna, nossa 
preocupaijao nao e essa, mas sim descobrir como a altura media dos filhos varia, dada a altura dos 
pais. Estamos interessados em prever a altura media dos filhos com base no conhecimento da al¬ 
tura dos pais. Para melhor entender o conceito, observe a Figura 1.1, um diagrama de dispersao. 


1 GALTON, Francis. "Family likeness in stature". Proceedings of Royal Society, Londres, 1886. v. 40, p. 42-72. 
2 PEARSON, K.; LEE, A. "On the laws of inheritance". Biometrika, nov. 1903. v. 2, p. 357-462. 
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FIGURA 1.1 

Distribuigao 
hipotetica das alturas 
dos filhos em relagao 
a altura dos pais. 



Altura dos pais (em metros) 


A figura mostra a distribuigao das alturas dos filhos, em uma populagao hipotetica, correspon- 
dentes aos valores dados, ou fixos , da altura do pai. Note que, para cada altura do pai dada, ha uma 
faixa ou distribuigao de alturas dos filhos. Observe que apesar da variagao da altura dos filhos para 
um dado valor da altura dos pais, a altura media dos filhos, em geral, aumenta com o aumento 
da altura do pai. As crazes assinaladas com um cfrculo indicam a altura media dos filhos cor- 
respondente a uma dada altura dos pais. Conectando essas medias, obtemos a linha mostrada na 
figura. Essa linha, como veremos, e conhecida como linha de regressao. Ela mostra como a altura 
media dos filhos aumenta com a altura dos pais. 3 

2. Consideremos o diagrama de dispersao da Figura 1.2, que apresenta a distribuigao, em uma 
populagao hipotetica, das alturas de meninos em idades ftxas. Para cada idade, temos uma faixa, 
ou distribuigao, de alturas. Obviamente, nem todos os meninos de uma mesma idade terao uma 
altura identica. 

Mas a altura, em media, aumenta com a idade (ate certa idade, e claro), o que pode ser visto 
claramente se tragarmos uma linha (a de regressao) que passe pelos pontos circulados que repre- 
sentam a altura media em cada idade. Conhecendo a idade, podemos prever, por meio da linha de 
regressao, a altura media correspondente a essa idade. 

3. Passando a exemplos economicos, um economista poderia estar interessado em estudar a relagao 
de dependencia das despesas de consumo pessoal e a renda pessoal disponfvel, apos o paga- 
mento de impostos. Essa analise e util para estimar a propensao marginal a consumir (PMC), isto 
e, a variagao media nas despesas de consumo, para uma variagao de um dolar na renda real. 

4. Um monopolista com possibilidade de fixar o prego ou a produgao (mas nao ambos) pode querer 
descobrir a resposta da demanda por um produto perante variagoes nos pregos. Isso nos permitiria 
estimar a elasticidade-prego (isto e, a resposta dos pregos) da demanda pelo produto e contribuiria 
para determinar o prego mais lucrativo. 

5. Um economista do trabalho pode querer estudar a relagao entre a variagao dos salarios nominais 
e a taxa de desemprego. O diagrama de dispersao da Figura 1.3 mostra os dados historicos. A 
curva tragada e um exemplo da famosa curva de Phillips , que relaciona as variagoes nos salarios 


3 Neste estagio do desenvolvimento de nosso assunto, chamaremos a linha de regressao de linha que conecta o valor 
medio da variavel dependente (altura dos filhos) correspondente a um dado valor da variavel explanatory (altura dos pais). 
Note que essa linha tem uma inclinagao positiva, mas menor que 1, o que esta de acordo com a regressao a 
mediocridade de Galton. (Por que?) 
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FIGURA 1.2 

Distribuigao 
hipotetica de alturas 
em relagao a idades 
selecionadas. 



Idade (em anos) 


FIGURA 1.3 

Curva de Phillips 
hipotetica. 



nominais com a taxa de desemprego. Esse diagrama de dispersao permitiria ao economista pre- 
ver a variagao media dos salarios para uma dada taxa de desemprego. Tal conhecimento poderia 
contribuir para esclarecer o processo inflacionario de uma economia, visto que o aumento dos 
salarios nominais tende a refletir-se em aumento de pregos. 

6. A economia monetaria diz que, sendo tudo o mais constante, quanto mais alta a taxa de inflagao, n, 
menor a proporgao k de sua renda que as pessoas desejarao manter sob forma monetaria, conforme 
mostra a Figura 1.4. A curva da linha representa a mudanga em k em relagao ao indice de inflagao. 
Uma analise quantitativa dessa relagao permitiria ao economista prever a quantidade de moeda, 
como proporgao de sua renda, que as pessoas desejariam manter sob diferentes taxas de inflagao. 

7. O diretor de marketing de uma empresa pode querer saber como a demanda dos produtos de sua 
empresa relaciona-se com as despesas com publicidade. Esse estudo seria de grande utilidade para 
determinar a elasticidade da demanda em relagao as despesas com publicidade, isto e, a variagao 
percentual da demanda em resposta a uma variagao de 1% nas despesas com publicidade. Essa in- 
formagao pode ser util para determinar o orgamento de publicidade "ideal". 
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FIGURA 1.4 

Saldos monetarios em 
rela§ao a taxa de 
inflate), n. 


Moeda 


Renda 



8. Por fim, um agronomo pode estar interessado em estudar a dependencia do rendimento de deter- 
minada plantagao em relagao a temperatura, a quantidade de chuva e de sol e a aplica§ao de fer- 
tilizantes. A analise de dependencia permitiria a ele prever ou prognosticar o rendimento medio 
da lavoura, dadas as informa 5 oes sobre as variaveis explanatorias. 

O leitor pode imaginar muitos outros exemplos da dependencia de uma variavel em relapao a uma 
ou mais variaveis. As tecnicas de analise de regressao examinadas neste livro destinam-se especial- 
mente a estudar essa dependencia entre variaveis. 


1.3 Rela^oes estatisticas versus deterministic as 


Nos exemplos citados na Se£ao 1.2, o leitor notou que, na analise de regressao, estamos preocu- 
pados com o que e conhecido como dependencia estatistica, e nao funcional ou deterministica , entre as 
variaveis, como aquelas da ffsica classica. Nas redoes estatisticas entre variaveis, lidamos essencial- 
mente com variaveis aleatorias ou estocasticas, 4 isto e, variaveis que tem distributes probabilfsticas. 
Por outro lado, na dependencia funcional ou deterministica, tambem lidamos com variaveis, mas estas 
nao sao aleatorias ou estocasticas. 

A dependencia do rendimento das lavouras em rela§ao a temperatura, pluviosidade, luz solar ou 
fertilizante, por exemplo, e de natureza estatistica no sentido de que as variaveis explanatorias, embora 
importantes, nao permitirao ao agronomo prever exatamente o rendimento devido aos erros envolvidos 
na medi£ao dessas variaveis, assim como a diversos outros fatores (variaveis) que coletivamente afetam 
o rendimento, mas cuja identificapao individual pode ser dificil. Uma variabilidade "intrinseca" ou 
aleatoria tende a existir na variavel dependente "rendimento da lavoura" que nao pode ser totalmente 
explicada independentemente do numero de variaveis explanatorias consideradas. 

Por outro lado, nos fenomenos determimsticos, lidamos com rclacdes do tipo exibido pela lei da 
gravidade de Newton, que diz: cada partfcula do universo atrai todas as outras partfculas com uma 
for§a diretamente proporcional ao produto de suas massas e inversamente proporcional ao quadrado da 
distancia entre elas. Simbolicamente, F= kUn^ndr 1 ), em que F = for§a, m x e m 2 sao as massas das duas 
partfculas, re a distancia entre elas e k = constante de proporcionalidade. Outro exemplo e a lei de Ohm, 


4 A palavra estocastica vem do grego stokhos, que significa "olho de boi" [ou "centra do alvo" em ingles]. O re- 
sultado do lan^amento de um dardo ao alvo e um processo estocastico, isto e, um processo em que nem 
sempre o centra do alvo e atingido. 
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que diz: no caso de condutores metalicos dentro de certa faixa de temperature, a corrente C e propor- 
cional a voltagem V ; isto eC= em que ], e a constante de proporcionalidade. Outros exemplos 
dessas relapocs deterministicas sao a lei de Boyle para o gas, a lei de Kirchhoff para a eletricidade e a 
de Newton para o movimento. 

Neste livro, nao nos preocupamos com essas rclapoes deterministicas. Obviamente, se houver er- 
ros de med^ao no k da lei da gravidade de Newton, a relagao determinfstica torna-se uma rela9ao 
estatfstica. Nessa situa9ao, a fcurja so pode ser prevista aproximadamente com base no valor de k 
(e m\, m 2 e r). que content erros. A variavel F, nesse caso, toma-se uma variavel aleatoria. 


1.4 Regressao versus causa^ao 


Embora a analise de regressao lide com a dependencia de uma variavel em rela9ao a outras, isso nao 
implica necessariamente uma causa9ao. Nas palavras de Kendall e Stuart, "uma relayao estatfstica, por 
mais forte e sugestiva que seja, nunca pode estabelecer uma conexao causal: nossas ideias de causa?ao 
devem vir de fora da estatfstica, em ultima analise, de alguma teoria". * * * * 5 

No exemplo do rendimento da lavoura citado anteriormente, nao ha razao estatistica para supor que 
a chuva nao dependa do rendimento da lavoura. O fato de tratarmos o rendimento da lavoura como 
dependente (dentre outras coisas) da chuva decorre de considera9oes nao estatfsticas: o senso comum 
sugere que a rela9ao nao pode ser invertida, pois nao podemos controlar a pluviosidade por meio de 
uma varia5ao no rendimento da lavoura. 

Em todos os exemplos citados na Se9ao 1.2, e importante notar que uma rela^ao estatfstica por 
si propria nao implica logicamente uma causa^ao. Para atribuir causagao, devemos recorrer a 
considera5oes a priori ou teoricas. Portanto, no terceiro exemplo citado, podemos invocar a teoria 
economica para dizer que as despesas de consumo dependem da renda real. 6 


1.5 Regressao versus correla^ao 

A analise de correla^ao, cujo principal objetivo e medir a forga ou o grau de associacdo linear 
entre duas variaveis esta estreitamente relacionada a analise de regressao, mas conceitualmente e 
muito diferente. O coeficiente de correla^ao, que estudaremos em detalhe no Capitulo 3, mede a 

for9a dessa associa9ao (linear). Por exemplo, podemos estar interessados em determinar o coeficien¬ 
te de correla9ao entre: fumar e cancer de pulmao; entre as notas obtidas nas provas de estatfstica e de 
matematica; entre as notas obtidas no ensino medio e na faculdade e assim por diante. Na analise 
de regressao, como ja mencionamos, nao estamos interessados prioritariamente nessa medida. Em 
vez disso, buscamos estimar ou prever o valor medio de uma variavel com base nos valores fixos de 
outras variaveis. Portanto, talvez queiramos saber se e possfvel prever a nota media de uma prova 
de estatfstica conhecendo as notas do estudante na prova de matematica. 

A regressao e a corre^ao tem algumas diferen9as fundamentals que vale a pena mencionar. Na 

analise de regressao, existe uma assimetria na maneira como as variaveis dependente e explanatoria 
sao tratadas. Supomos que a variavel dependente seja estatfstica, aleatoria ou estocastica, isto e, que 
tenha distribui9ao probabilfstica. Por outro lado, consideramos que as variaveis explanatorias tem 
valores fixos (em amostras repetidas), 7 que foram explicitados na defini9ao de regressao dada na 
Se9ao 1.2. Portanto, na Figure 1.2, supusemos que a variavel "idade" foi fixada em dados niveis e 


5 KENDALL, M. G.; STUART, A. The advanced theory of statistics. Nova York: Charles Griffin Publishers, 1961. v. 2, 
cap. 26, p. 279. 

6 Mas, como veremos no Capitulo 3, a analise de regressao classica se alicerfa no pressuposto de que o mo- 
delo utilizado na analise e o correto. Portanto, a diregao da causalidade pode estar implfcita no modelo 
postulado. 

7 E fundamental observar que as variaveis explanatorias podem ser intrinsecamente estocasticas, mas, para fins de 
analise de regressao, pressupomos que seus valores sao fixados em amostras repetidas (isto e, que X assume os 
mesmos valores em varias amostras), tornando-as, assim, nao aleatorias ou nao estocasticas. Veremos esse as- 
sunto com mais detalhes no Capitulo 3, Segao 3.2. 
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que as medigoes de altura foram obtidas nesses nfveis. Na analise de correlagao, por outro lado, 
tratamos quaisquer (duas) variaveis simetricamente; nao ha distingao entre as variaveis dependente 
e explanatoria. Afinal, a correlagao entre as notas nas provas de matematica e de estatistica e a mes- 
ma que aquela entre as notas das provas de estatistica e de matematica. Alem disso, supoe-se que as 
duas variaveis sejam aleatorias. Como veremos, a maior parte da teoria da correlagao baseia-se na 
premissa da aleatoriedade das variaveis, enquanto boa parte da teoria da regressao a ser exposta 
neste livro esta condicionada a premissa de que a variavel dependente e estocastica, mas as variaveis 
explanatorias sao fixas ou nao estocasticas. 8 


1.6 Terminologia e nota^ao 

Antes de prosseguirmos para a analise formal da teoria da regressao, vejamos brevemente a termi¬ 
nologia e a notagao. Na literatura, os termos variavel dependente e variavel explanatoria sao descritos 
de varios modos. Uma lista representativa e: 


Variavel dependente 

Variavel explicativa 

t 

t 

Variavel explicada 

Variavel independente 

$ 

t 

Variavel prevista 

Previsor 

$ 

$ 

Regressando 

Regressor 

$ 

$ 

Resposta 

Estimulo 

$ 


Variavel endogena 

Variavel exogena 

$ 

0 

Saida 

Entrada 

t 


Variavel controlada 

Variavel de controle 


Embora seja uma questao de gosto pessoal e de tradigao, neste texto adotaremos a terminologia 
variavel dependente/variavel explanatoria ou os termos mais neutros regressando e regressor. 

Se estudamos a dependencia de uma variavel em relagao a uma unica variavel explanatoria, como e 
o caso das despesas de consumo em relagao a renda real, esse estudo e conhecido como analise de re¬ 
gressao simples ou de duas variaveis. No entanto, se estudarmos a dependencia de uma variavel a mais 
de uma variavel explanatoria, como no caso da relagao entre rendimento da lavoura e chuva, temperatura, 
luz do sol e fertilizantes, sera uma analise de regressao multipla. Em outras palavras, em uma regressao 
de duas variaveis ha somente uma unica variavel explanatoria, enquanto na regressao multipla ha mais de 
uma variavel explanatoria. 

O termo aleatorio e sinonimo de estocastico. Como j a mencionado, uma variavel aleatoria, ou estocas¬ 
tica, e aquela que pode assumir qualquer valor, positivo ou negativo, dentro de um conjunto de valores 
com uma dada probabilidade. 9 


8 No tratamento avangado da econometria, pode-se relaxar a premissa do carater nao estocastico das variaveis 
explanatorias (veja introdugao a Parte 2). 

9 Veja o Apendice A para uma definigao formal e detalhes adicionais. 
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A menos que seja definido de outra forma, a letra Y denotara a variavel dependente e os X (X b 
X 2 ,X k ) representarao as variaveis explanatorias, sendo X k a k-esima variavel explanatoria; os subscri- 
tos i ou t denotarao a i-esima ou t-esima observa^ao ou valor; X ki (ou X kt ) denotara a i-esima (ou t- 
esimd) observagao da variavel X k , N (ou 7) denotara o numero total de observagoes ou valores da 
populagao; e n (ou 1), o numero total de observances de uma amostra. Por convengao, o subscrito i da 
observagao sera usado para dados de corte transversal (isto e, dados coletados em um ponto no tem¬ 
po) e o subscrito t para os dados de series temporais (isto e, dados coletados ao longo de um 
intervalo de tempo). A natureza dos dados de corte transversal e das series temporais, bem como o 
importante topico da natureza e das fontes de dados para a analise empmca, e examinada a seguir. 

1.7 Natureza e fonte dos dados para a analise economica 10 

O sucesso de qualquer analise econometrica depende, em ultima instancia, da disponibilidade de 
dados adequados. Portanto e essencial dedicarmos algum tempo examinando a natureza, as fontes e as 
limitagoes dos dados que podem aparecer na analise empfrica. 

Tipos de dados 

Tres tipos de dados podem estar dispomveis para a analise empmca: dados de series temporais, 
de corte transversal e combinados (isto e, a combi nagao de series temporais com os dados de corte 
transversal). 

Series temporais 

Os dados apresentados na Tabela 1.1 da Introdugao sao um exemplo de dados de series temporais. 
Uma serie temporal e um conjunto de observances dos valores que uma variavel assume em diferentes 
momentos do tempo. Esses dados podem ser coletados a intervalos regulares, como diariamente 
(pregos das agoes, relatorios meteorologicos), semanalmente (informagoes sobre oferta de moeda), 
mensalmente (taxa de desemprego, indice de pregos ao consumidor [IPC]), trimestralmente (P1B), 
anualmente (orgamento do governo), quinquenalmente, isto e, a cada cinco anos (censo industrial 
dos Estados Unidos), ou decenalmente (censo demografico). As vezes, os dados estao dispomveis em 
series trimestrais e anuais, como no caso do P1B e das despesas de consumo. Com o advento dos com- 
putadores de alta velocidade, os dados agora podem ser coletados a intervalos extremamente curtos, 
como os relativos a pregos das agoes, obtidos de forma praticamente contmua (as chamadas cotagoes 
em tempo real). 

Embora as series temporais sejam muito usadas nos estudos econometricos, apresentam proble- 
mas especiais para o econometrista. Como veremos mais adiante nos capftulos sobre econometria 
das series temporais, a maioria dos estudos empiricos embasados nesse tipo de dado pressupoe que 
a serie temporal subjacente seja estacionaria. Embora ainda seja muito cedo para apresentar o signi- 
ficado tecnico preciso dessa caracteristica, de maneira geral, uma serie e estacionaria se sua media 
e variancia nao variant sistematicamente ao longo do tempo. Para entender o que isso significa, con- 
sidere a Figura 1.5, que ilustra o comportamento da oferta de moeda, no seu conceito de Ml, nos Esta¬ 
dos Unidos de 1° de janeiro de 1959 a setembro de 1999. (Os dados numericos sao apresentados no 
Exercicio 1.4.) Como podemos ver na figura, a oferta de moeda Ml mostra uma firme tendencia ascen- 
dente, assim como uma variabilidade ao longo dos anos, sugerindo que a serie temporal de Ml nao e 
estacionaria. 11 Exploraremos este topico por completo no Capitulo 21. 


10 Para um relato informativo, veja o livro de INTRILIGATOR, Michael D. Econometric models, techniques and applications. 
Englewood Cliffs, N. J.: Prentice Hall, 1978. 

11 Para melhor entendermos, dividimos os dados em quatro perfodos: de janeiro de 1951 a dezembro de 1962, de 
janeiro de 1963 a dezembro de 1974; de janeiro de 1975 a dezembro de 1986; e de janeiro de 1987 a setembro 
de 1999. Os valores medios da oferta de moeda (e seus desvios padrao entre parenteses) foram de, respectivamen- 
te, 165,88 (23,27); 323,20 (72,66); 788,12 (195,43); e 1.099 (27,84), todos os dados em bilhoes de dolares. Isso e 
uma indicagao grosseira do fato de que a oferta de moeda nao foi estacionaria durante todo o perfodo. 
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FIGURA 1.5 

Oferta de moeda Ml, 
nos Estados Unidos, 
janeiro de 1951 a 
setembro de 1999. 



Dados em corte transversal 

Estes sao dados em que uma ou mais variaveis foram coletadas no mesmo ponto do tempo, como 
o censo demografico que e feito a cada dez anos (o mais recente e de 2000), as pesquisas de despesas 
do consumidor conduzidas pela Universidade de Michigan e, naturalmente, as pesquisas de opiniao 
feitas pelo Gallup e inumeras outras organizanoes. A Tabela 1.1 apresenta um exemplo concreto de 
dados em corte transversal. Nela estao dados da produ§ao e dos prenos dos ovos nos 50 Estados 
americanos nos anos de 1990 e 1991. 

Para cada ano, os dados dos 50 Estados sao um corte transversal. Portanto, na Tabela 1.1 temos 
duas amostras em corte transversal. 

Assim como as series temporais tem problemas especiais (devido a questao do carater esta- 
cionario), os dados em corte transversal tambem tem seus problemas, especificamente o da he- 
terogeneidade. Nos dados da Tabela 1.1 podemos ver que alguns estados produzem uma imensa 
quantidade de ovos (por exemplo, a Pensilvania) e outros, muito pouco (como o Alasca). Quan- 
do incluimos dados tao heterogeneos em uma analise estatistica, o efeito magnitude ou escala 
deve ser levado em conta a fim de nao misturarmos mafas com laranjas. Para melhor entender- 
mos, na Figura 1.6, plotamos os dados sobre ovos produzidos e seus prenos nos 50 Estados no 
ano de 1990. Esta figura mostra como as observances estao dispersas. No Capitulo 11, veremos 
como o efeito escala pode ser um fator importante ao estimarmos relagoes entre variaveis eco¬ 
nomicas. 

Dados combinados 

Nos dados combinados, ha elementos tanto de series temporais quanto de corte transversal. Nos 
dados da Tabela 1.1, ha um exemplo de dados combinados. Para cada um dos anos, temos 50 obser¬ 
vances de corte transversal e, para cada estado, duas observances de series temporais de prenos e 
quantidade de ovos, em um total de cem observances combinadas. 

Do mesmo modo, os dados no Exercfcio 1.1 sao dados combinados, pois o mdice de Prenos ao 
Consumidor (IPC) de cada pais para o periodo 1980-2005 e uma serie temporal, enquanto os dados 
do IPC para os sete paises em um tinico ano sao de corte transversal. Nos dados combinados, temos 
um total de 182 observances — 26 observances anuais para cada um dos sete paises. 
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TAB E LA 1.1 Produgao de ovos nos Estados Unidos 


Estado 


y 2 

*i 

*2 

Estado 

Y^ 

y 2 

*i 

*2 

AL 

2.206 

2.186 

92,7 

91,4 

MT 

172 

164 

68,0 

66,0 

AK 

0,7 

0,7 

151,0 

149,0 

NE 

1.202 

1.400 

50,3 

48,9 

AZ 

73 

74 

61,0 

56,0 

NV 

2,2 

1,8 

53,9 

52,7 

AR 

3.620 

3.737 

86,3 

91,8 

NH 

43 

49 

109,0 

104,0 

CA 

7.472 

7.444 

63,4 

58,4 

Nj 

442 

491 

85,0 

83,0 

CO 

788 

873 

77,8 

73,0 

NM 

283 

302 

74,0 

70,0 

CT 

1.029 

948 

106,0 

104,0 

NY 

975 

987 

68,1 

64,0 

DE 

168 

164 

117,0 

113,0 

NC 

3.033 

3.045 

82,8 

78,7 

FL 

2.586 

2.537 

62,0 

57,2 

ND 

51 

45 

55,2 

48,0 

GA 

4.302 

4.301 

80,6 

80,8 

OH 

4.667 

4.637 

59,1 

54,7 

HI 

227,5 

224,5 

85,0 

85,5 

OK 

869 

830 

101,0 

100,0 

ID 

187 

203 

79,1 

72,9 

OR 

652 

686 

77,0 

74,6 

IL 

793 

809 

65,0 

70,5 

PA 

4.976 

5.130 

61,0 

52,0 

IN 

5.445 

5.290 

62,7 

60,1 

Rl 

53 

50 

102,0 

99,0 

IA 

2.151 

2.247 

56,5 

53,0 

SC 

1.422 

1.420 

70,1 

65,9 

KS 

404 

389 

54,5 

47,8 

SD 

435 

602 

48,0 

45,8 

KY 

412 

483 

67,7 

73,5 

TN 

277 

279 

71,0 

80,7 

LA 

273 

254 

115,0 

115,0 

TX 

3.317 

3.356 

76,7 

72,6 

ME 

1.069 

1.070 

101,0 

97,0 

UT 

456 

486 

64,0 

59,0 

MD 

885 

898 

76,6 

75,4 

VT 

31 

30 

106,0 

102,0 

MA 

235 

237 

105,0 

102,0 

VA 

943 

988 

86,3 

81,2 

Ml 

1.406 

1.396 

58,0 

53,8 

WA 

1.287 

1.313 

74,1 

71,5 

MN 

2.499 

2.697 

57,7 

54,0 

WV 

136 

174 

104,0 

109,0 

MS 

1.434 

1.468 

87,8 

86,7 

Wl 

910 

873 

60,1 

54,0 

MO 

1.580 

1.622 

55,4 

51,5 

WY 

1,7 

1,7 

83,0 

83,0 


Nota: Y\ = milhoes de ovos produzidos em 1990. 

Y 2 = milhoes de ovos produzidos em 1991. 

X 1 = pre^o dos ovos em 1990 (centavos de dolar por duzia). 

X 2 = prego dos ovos em 1991 (centavos de dolar por duzia). 

Fonte: World Almanac, 1993, p. 119. Os dados sao do Economic Research Service. U.S. Department of Agriculture. 


Dados em painel, longitudinals ou de micropainel 

Sao um tipo especial de dados combinados nos quais a mesma unidade em corte transversal (por 
exemplo, uma famflia ou uma empresa) e pesquisada ao longo do tempo. Por exemplo, o Departa- 
mento de Comercio dos Estados Unidos realiza periodicamente um censo habitacional. Em cada levan- 
tamento, o mesmo domicflio (ou as pessoas que moram no mesmo endere£o) e entrevistado para 
verificar se houve alguma alterapao nas condi?5es da residencia e das finanpas domiciliares desde o 
ultimo levantamento. Ao entrevistarmos os mesmos domicflios periodicamente, os dados em painel 
proporcionam informa 5 oes muito uteis sobre a dinamica do seu comportamento, como veremos no 
Capftulo 16. 

Como um exemplo concreto, considere os dados fornecidos na Tabela 1.2. Os dados da tabela, 
coletados originalmente por Y. Grunfeld, referem-se ao investimento, ao valor da empresa e ao esto- 
que de capital reais de quatro empresas americanas - a saber: General Electric (GE), U.S. Steel (US), 
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FIGURA 1.6 
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General Motors (GM) e Westinghouse (WEST) - para o perfodo de 1935-1954. 12 Como os dados fo- 
ram coletados para diversas empresas ao longo de um numero de anos, este e um exemplo classico de 
dados em painel. Nessa tabela, o numero de observa£6es para cada empresa e o mesmo, mas nem 
sempre e esse o caso. Se o numero de observa£6es for o mesmo para todas as empresas, teremos um 
painel balanceado; se o numero de observances nao for o mesmo para todas as empresas, teremos 
um painel desbalanceado. No Capitulo 16, “Modelos de regressao de dados em painel”, examinare- 
mos tais dados e mostraremos como estimar os modelos. 

O proposito de Grunfeld ao coletar esses dados era verificar quanto o investimento bruto real (I) 
depende do valor real da empresa ( F) no ano anterior e do estoque de capital real (C) no ano anterior. 
Como as empresas inclufdas no exemplo operam no mesmo mercado de capital, ao estuda-las juntas, 
Grunfeld queria verificar se tinham as mesmas funpbes de investimento. 

As fontes de dados 13 

Os dados utilizados para as analises empiricas podem ser coletados por orgaos do govemo (por 
exemplo, Departamento de Comercio dos Estados Unidos), organismos intemacionais (por exemplo, 
Fundo Monetario Internacional, FMI, ou o Banco Mundial), por organizapoes privadas (por 
exemplo, Standard & Poor’s Corporation) ou por pessoas fisicas. Ha literalmente milhares dessas 
instituipSes coletando dados com diversas finalidades. 

A Internet 

A Internet causou uma verdadeira revoluqao na coleta de dados. Basta navegar na rede a partir 
de uma palavra-chave (como taxa de cambio) que voce sera soterrado por todo tipo de fonte de da¬ 
dos. No Apendice E, apresentamos uma sele£ao de sites frequentemente visitados que proporcio- 
nam dados economicos e financeiros de todos os tipos. A maior parte dos dados pode ser baixada 
sem grande custo. Voce pode incluir alguns desses sites que oferecem dados economicos uteis em 
sua lista de favoritos. 

Os dados coletados pelas varias instituigocs podem ser experimentais e nao experimentais. Os 
experimentais referem-se, em geral, as ciencias naturais e o pesquisador costuma coleta-los mantendo 


12 GRUNFELD, Y. The determinants of corporate investment. 1958. Tese (Doutorado) - Departmento de Econo- 
mia da Universidade de Chicago, 1958. Trabalho nao publicado. Esses dados se tornaram referenda para ilus- 
trar modelo de regressao de dados em painel. 

13 Para informapoes esclarecedoras, veja SOMERS, Albert T. The U.S. economy demystified: What the major 
economic statistics mean and their significance for business. Lexington, Mass.: D. C. Heath, 1985. 
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TABELA 1.2 Dados de investimentos para quatro empresas, 1935-1954 


Observagao 

/ 

f-1 

C! 

Observa^ao 

/ 

F-i 

C i 


GE 




US 



1935 

33,1 

11 70,6 

97,8 

1935 

209,9 

1 362,4 

53,8 

1936 

45,0 

2015,8 

104,4 

1936 

355,3 

1807,1 

50,5 

1937 

77,2 

2803,3 

118,0 

1937 

469,9 

2673,3 

118,1 

1938 

44,6 

2039,7 

156,2 

1938 

262,3 

2039,7 

260,2 

1939 

48,1 

2256,2 

172,6 

1939 

230,4 

1957,3 

312,7 

1940 

74,4 

2132,2 

186,6 

1940 

361,6 

2202,9 

254,2 

1941 

113,0 

1834,1 

220,9 

1941 

472,8 

2380,5 

261,4 

1942 

91,9 

1588,0 

287,8 

1942 

445,6 

2168,6 

298,7 

1943 

61,3 

1 749,4 

319,9 

1943 

361,6 

1985,1 

301,8 

1944 

56,8 

1687,2 

321,3 

1944 

288,2 

1813,9 

279,1 

1945 

93,6 

2007,7 

319,6 

1945 

258,7 

1850,2 

213,8 

1946 

159,9 

2208,3 

346,0 

1946 

420,3 

2067,7 

232,6 

1947 

147,2 

1656,7 

456,4 

1947 

420,5 

1796,7 

264,8 

1948 

146,3 

1 604,4 

543,4 

1948 

494,5 

1625,8 

306,9 

1949 

98,3 

1431,8 

618,3 

1949 

405,1 

1667,0 

351,1 

1950 

93,5 

1610,5 

647,4 

1950 

418,8 

1677,4 

357,8 

1951 

135,2 

1819,4 

671,3 

1951 

588,2 

2289,5 

341,1 

1952 

157,3 

2079,7 

726,1 

1952 

645,2 

2159,4 

444,2 

1953 

179,5 

2371,6 

800,3 

1953 

641,0 

2031,3 

623,6 

1954 

189,6 

2759,9 

888,9 

1954 

459,3 

2115,5 

669,7 


CM 




WEST 



1935 

317,6 

3078,5 

2,8 

1935 

12,93 

191,5 

1,8 

1936 

391,8 

4661,7 

52,6 

1936 

25,90 

516,0 

0,8 

1937 

410,6 

5387,1 

156,9 

1937 

35,05 

729,0 

7,4 

1938 

257,7 

2792,2 

209,2 

1938 

22,89 

560,4 

18,1 

1939 

330,8 

4313,2 

203,4 

1939 

18,84 

519,9 

23,5 

1940 

461,2 

4643,9 

207,2 

1940 

28,57 

628,5 

26,5 

1941 

512,0 

4551,2 

255,2 

1941 

48,51 

537,1 

36,2 

1942 

448,0 

3244,1 

303,7 

1942 

43,34 

561,2 

60,8 

1943 

499,6 

4053,7 

264,1 

1943 

37,02 

617,2 

84,4 

1944 

547,5 

4379,3 

201,6 

1944 

37,81 

626,7 

91,2 

1945 

561,2 

4840,9 

265,0 

1945 

39,27 

737,2 

92,4 

1946 

688,1 

4900,0 

402,2 

1946 

53,46 

760,5 

86,0 

1947 

568,9 

3526,5 

761,5 

1947 

55,56 

581,4 

111,1 

1948 

529,2 

3245,7 

922,4 

1948 

49,56 

662,3 

130,6 

1949 

555,1 

3700,2 

1020,1 

1949 

32,04 

583,8 

141,8 

1950 

642,9 

3755,6 

1099,0 

1950 

32,24 

635,2 

136,7 

1951 

755,9 

4833,0 

1207,7 

1951 

54,38 

732,8 

129,7 

1952 

891,2 

4924,9 

1430,5 

1952 

71,78 

864,1 

145,5 

1953 

1 304,4 

6241,7 

1777,3 

1953 

90,08 

1193,5 

174,8 

1954 

1486,7 

5593,6 

2226,3 

1954 

68,60 

1188,9 

213,5 


Notas: Y = I = investimento bruto = adigoes a planta e equipamentos mais manutengao e reparos, em milhoes de dolares deflacionados por Pj. 

X 2 = F = valor da empresa = prego das agoes ordinarias e preferenciais em 31 de dezembro (ou prego medio em 31 de dezembro e 31 de janeiro do ano seguinte) 
multiplicado pelo numero de agoes preferenciais em circulagao mais o valor presente total da divida em 31 de dezembro, em milhoes de dolares 
deflacionados por P 2 . 

X 3 = C = estoque na planta e de equipamentos = soma acumulada das adigoes liquidas a planta e aos equipamentos deflacionadas por Pj subtrafda da provisao de 
depreciagao deflacionada por P 3 nessas definigdes. 

Pj = deflator de prego implicito dos equipamentos duraveis do produtor (1947 = 100). 

P 2 = deflator de prego implicito P1B (1947 = 100). 

P 3 = deflator de despesas de depreciagao = varigao media em 10 anos do rndice de pregos no atacado dos metais e produtos metalicos (1947 = 100). 

Fonte: reproduzido de VINOD, H. D.; ULLAH, Aman. Recent advances in regression methods. Nova York: Marcel Dekker, 1981. p. 259-261. 
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certos fatores constantes para avaliar o impacto de outros aspectos sobre o fenomeno. Por exemplo, 
para avaliar o impacto da obesidade sobre a pressao sanguinea, o pesquisador coletara dados para 
manter constantes os habitos de alimenta^ao, fumo e bebida das pessoas a fim de minimizar a influen- 
cia dessas variaveis sobre a pressao sangumea. 

Nas ciencias sociais, os dados encontrados em geral sao de natureza nao experimental, isto e, nao 
sao controlados pelo pesquisador. 14 Por exemplo, os dados relativos ao P1B, ao desemprego, aos pre?os 
das a£oes etc. nao estao sob o controle direto do pesquisador. Como veremos, a falta de controle geral- 
mente cria problemas para o pesquisador que busca a(s) causa(s) exata(s) que afeta(m) uma situa£ao 
em particular. Por exemplo, e a oferta de moeda que determina o P1B (nominal) ou e o inverso? 

A precisao dos dados 15 

Embora haja fartura de dados disponfveis para a pesquisa economica, sua qualidade muitas vezes 
deixa a desejar. Ha varias razoes para tanto: 

1. Como j a foi mencionado, a maioria dos dados das ciencias sociais sao nao experimentais por 
natureza. Portanto, ha a possibilidade de ocorrerem erros de observayao, sejam intencionais 
ou nao. 

2. Mesmo no caso dos dados experimentais, erros de med^ao surgem em decorrencia de apro- 
ximagoes e arredondamentos. 

3. Nos levantamentos feitos por meio de questionarios, o problema da falta de respostas pode 
ser grave; o pesquisador tera sorte se conseguir que 40% dos questionarios sejam respondi- 
dos. Analises embasadas nessas respostas parciais podem nao refletir verdadeiramente o 
comportamento dos 60% que nao responderam, levando assim ao que e conhecido como vies 
de selegao (da amostra). E ha, ainda, o problema de que aqueles que respondent ao questio- 
nario nao o fazem de forma completa, especialmente perguntas sobre topicos financeiros 
delicados, levando a novo vies de selegao. 

4. Os metodos de amostragem usados para a obtengao dos dados variam tanto que muitas vezes 
e dificil comparar os resultados obtidos em diversas amostras. 

5. Os dados economicos em geral sao apresentados em um nivel muito agregado. Por exemplo, 
a maior parte dos macrodados (por exemplo, PIB, emprego, inflagao, desemprego) so estao 
disponiveis para a economia como um todo ou para algumas grandes regioes geograficas. 
Esses dados muito agregados pouco nos dizem sobre as microunidades individuals que po¬ 
dem ser o objetivo final do estudo. 

6. Devido a confidencialidade, certos dados so sao publicados em forma muito agregada. A 
Receita Federal, por exemplo, nao pode por lei revelar dados sobre declaragoes individuals; 
so pode liberar alguns valores totais muito agregados. Quem deseja saber quanto as pessoas 
com dado nivel de renda gastam com satide, so pode verificar em nivel muito agregado, mas 
essa macroanalise muitas vezes deixa de revelar a dinamica do comportamento das microuni¬ 
dades. Do mesmo modo, o Departamento de Comercio, que conduz um censo das empresas 
a cada cinco anos, nao pode revelar informagoes sobre produgao, emprego, consumo de 
energia, gastos com pesquisa e desenvolvimento, etc. em nivel de empresa. Portanto, e difi¬ 
cil estudar as diferengas entre empresas em relagao a essas variaveis. 

Como consequencia desses e de muitos outros problemas, o pesquisador sempre deve ter em men- 
te que os resultados de sua pesquisa terao a mesma qualidade dos dados coletados. Em certas situa- 
5 oes, quando os pesquisadores concluem que os resultados de seu trabalho sao "insatisfatorios", a causa 
pode nao estar no uso do modelo errado, mas na ma qualidade dos dados. Infelizmente, devido a natureza 

14 Nas ciencias sociais as vezes tambem e possivel fazer experimentos controlados. No Exerdcio 1.6, daremos um 
exemplo. 

15 Para uma revisao critica, veja MORGENSTERN, O. The accuracy of economic observations. 2. ed. Princeton, N. J.: 
Princeton University Press, 1963. 
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nao experimental dos dados usados na maior parte dos estudos das ciencias sociais, os pesquisadores nao 
tem outra opcao senao depender daqueles dispomveis. Mas devem ter sempre em mente que os dados 
empregados podem nao ser os melhores e devem procurar nao ser muito dogmaticos quanto aos resulta- 
dos obtidos em determinado estudo, especialmente quando a qualidade dos dados nao e confiavel. 

Uma nota sobre as escalas de medigao das variaveis 16 

As variaveis que geralmente encontramos enquadram-se em quatro categorias amplas: escalas de 
razao, de intervalo, ordinal e nominal. E importante entender o que cada uma delas representa. 

Escala de razao 

Dada uma variavel X, que assume dois valores, X l e X 2 , a razao XJX 2 e a distancia (X 2 —X{) sao 
quantidades significativas. Tambem ha um ordenamento natural (ascendente ou descendente) dos va¬ 
lores ao longo da escala. Portanto, compara 5 oes como X 2 < X t ou X 2 > X ] fazem sentido. A maioria 
das variaveis economicas pertence a esta categoria. Faz sentido perguntar qual a difcrcnca quantitativa 
entre o PIB deste ano e o do ano anterior. A renda pessoal, medida em dolares, e uma escala de razao. 
Alguem com um salario de $ 100 mil ganha duas vezes mais que alguem com um salario de $ 50 mil 
(sem o desconto dos impostos, e claro). 

Escala de intervalo 

A escala de intervalo atende as duas ultimas propriedades da escala de razao, mas nao a primeira. 
A distancia entre dois periodos de tempo, por exemplo (2000-1995), e significativa, mas nao a razao 
entre eles (2000/1995). As 11 horas (horario local) de 11 de agosto de 2007, a cidade de Portland, em 
Oregon, registrava uma temperatura de 60 °F enquanto que Talahasse, na Florida, chegou a 90 °F. A 
temperatura nao e medida em uma escala de razao, pois nao faz sentido afirmar que Talahasse estava 
50% mais quente que Portland. Isso se deve principalmente ao fato de que a escala Fahrenheit nao usa 
0 grau como uma base natural. 

Escala ordinal 

Uma variavel se enquadra nesta categoria apenas se satisfaz a terceira propriedade da escala de razao 
(isto e, o ordenamento natural). Como exemplos, podemos citar os sistemas de avaliagao de alunos 
(conceitos A, B, C) ou as classes de renda (alta, media, baixa). No caso dessas variaveis, ha um ordena¬ 
mento, mas a distancia entre as categorias nao pode ser quantificada. Os estudantes de economia irao 
recordar-se das curvas de indiferenga entre dois bens, em que cada curva mais elevada indica um m'vel 
mais alto de utilidade, mas nao se pode quantificar quanto uma curva de indiferen 9 a e superior a outras. 

Escala nominal 

As variaveis desta categoria nao tem nenhuma das caracterfsticas das variaveis da escala de razao. 
Variaveis como genero (feminino, masculino) e estado civil (solteiro, casado, divorciado, separado) 
apenas denotam categorias. Pergunta: por que essas variaveis nao podem ser expressas em nenhuma 
das escalas anteriores? 

Como veremos, as tecnicas econometricas que podem ser adequadas a variaveis com escala de 
razao podem nao ser para as variaveis com escala nominal. E importante ter em mente os quatro tipos 
de escalas de medida descritas acima. 

Resumo e 
conclusoes 

1. A ideia principal por tras da analise de regressao e a dependencia estatistica de uma variavel, a 
dependente, a uma ou mais variaveis, as explanatorias. 

2. O objetivo dessa analise e estimar e/ou prever o valor medio da variavel dependente com base no 
valor conhecido ou fixado das variaveis explanatorias. 


16 As consideragoes a seguir baseiam-se em SPANOS, Aris. Probability theory and statistical inference: econometric 
modeling with observational data. Nova York: Cambridge University Press, 1999. p. 24. 




52 Parte Um Modelos de regressao com equagao unica 


3. Na pratica, o sucesso da analise de regressao depende da disponibilidade de dados adequados. 
Este capftulo discutiu a natureza, as fontes e as limita 5 oes dos dados que em geral estao disponiveis 
para as pesquisas, especialmente no campo das ciencias sociais. 

4. Em qualquer pesquisa, o pesquisador deve explicitar claramente as fontes dos dados usados na 
analise, suas dcfinigocs, seus metodos de coleta e quaisquer lacunas ou omissoes nos dados, bem 
como quaisquer revisoes realizadas. Nao devemos esquecer que os dados macroeconomicos 
publicados pelo governo sao revistos frequentemente. 

5. Como o leitor pode nao ter tempo, energia ou recursos para confirmar os dados, ele tem o direito 
de acreditar que os dados usados pelo pesquisador foram coletados de forma adequada e que os 
calculos e analises estao corretos. 


EXERCICIOS 1.1. ATabela 1.3 apresenta dados relativos ao Indice de Precjos ao Consumidor (IPC) de sete paises 
industrializados. Abase do indice e 1982-1984 = 100. 


TABELA 1.3 

IPC em sete paises 
industrializados. 

Ano 

EUA 

Canada 

Japao 

Franca 

Alemanha 

Italia 

Reino 

Unido 

1980-2005 

1980 

82,4 

76,1 

91,0 

72,2 

86,7 

63,9 

78,5 

(1982 - 1984 = 100) 

1981 

90,9 

85,6 

95,3 

81,8 

92,2 

75,5 

87,9 

Fonte: Economic Report of 
the President, 2007, Tabela 

1982 

96,5 

94,9 

98,1 

91,7 

97,0 

87,8 

95,4 

108, p. 354. 

1983 

99,6 

100,4 

99,8 

100,3 

100,3 

100,8 

99,8 


1984 

103,9 

104,7 

102,1 

108,0 

102,7 

111,4 

104,8 


1985 

107,6 

109,0 

104,2 

114,3 

104,8 

121,7 

111,1 


1986 

109,6 

113,5 

104,9 

117,2 

104,6 

128,9 

114,9 


1987 

113,6 

118,4 

104,9 

121,1 

104,9 

135,1 

119,7 


1988 

118,3 

123,2 

105,6 

124,3 

106,3 

141,9 

125,6 


1989 

124,0 

129,3 

108,0 

128,7 

109,2 

150,7 

135,4 


1990 

130,7 

135,5 

111,4 

132,9 

112,2 

160,4 

148,2 


1991 

136,2 

143,1 

115,0 

137,2 

116,3 

170,5 

156,9 


1992 

140,3 

145,3 

117,0 

140,4 

122,2 

179,5 

162,7 


1993 

144,5 

147,9 

118,5 

143,4 

127,6 

187,7 

165,3 


1994 

148,2 

148,2 

119,3 

145,8 

131,1 

195,3 

169,3 


1995 

152,4 

151,4 

119,2 

148,4 

133,3 

205,6 

175,2 


1996 

156,9 

153,8 

119,3 

151,4 

135,3 

213,8 

179,4 


1997 

160,5 

156,3 

121,5 

153,2 

137,8 

218,2 

185,1 


1998 

163,0 

157,8 

122,2 

154,2 

139,1 

222,5 

191,4 


1999 

166,6 

160,5 

121,8 

155,0 

140,0 

226,2 

194,3 


2000 

172,2 

164,9 

121,0 

157,6 

142,0 

231,9 

200,1 


2001 

177,1 

169,1 

120,1 

160,2 

144,8 

238,3 

203,6 


2002 

179,9 

172,9 

119,0 

163,3 

146,7 

244,3 

207,0 


2003 

184,0 

177,7 

118,7 

166,7 

148,3 

250,8 

213,0 


2004 

188,9 

181,0 

118,7 

170,3 

150,8 

256,3 

219,4 


2005 

195,3 

184,9 

118,3 

173,2 

153,7 

261,3 

225,6 
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a. Com base nos dados fornecidos, calcule a taxa de inflafao de cada pais. 17 

b. Represente graficamente a taxa de inflatjao de cada pais em relapao ao tempo (isto e, use o 
eixo horizontal para o tempo e o eixo vertical para a taxa de inflapao). 

c. Que conclusoes gerais e possivel tirar sobre a evolufao da inflac^ao nos sete paises? 

d. Em que pais a taxa de inflapao parece ser a mais flutuante? Ha alguma explicapao para isso? 

1.2. a. Usando a Tabela 1.3, represente as taxas de inflapao do Canada, Franca. Alemanha, Italia, 

Japao e Reino Unido em relapao a taxa de inflapao dos Estados Unidos. 

b. Fapa um comentario geral sobre o comportamento das taxas de inflapao dos seis paises em 
relapao a inflapao dos Estados Unidos. 

c. Se voce constatar que as taxas de inflapao dos seis paises evoluem no mesmo sentido que 
a dos Estados Unidos, isso sugere que a inflapao dos Estados Unidos "causa" inflapao nos 
outros paises? Justifique. 

1.3. A Tabela 1.4 apresenta as taxas de cambio em sete paises industrializados, no perfodo 1985- 
-2006. Exceto no caso do Reino Unido, as taxas de cambio estao definidas como unidades de 
moeda estrangeira por um dolar; no caso do Reino Unido, a taxa de cambio e dada como o nu- 
mero de dolares por uma libra esterlina. 


TABELA 1.4 Taxa de cambio de nove paises: 1985-2006 


Ano 

Australia 

Canada 

China 

Japao 

Mexico 

Coreia do 
Sul 

Suecia 

Suiga 

Reino 

Unido 

1985 

0,7003 

1,3659 

2,9434 

238,47 

0,257 

872,45 

8,6032 

2,4552 

1,2974 

1986 

0,6709 

1,3896 

3,4616 

168,35 

0,612 

884,60 

7,1273 

1,7979 

1,4677 

1987 

0,7014 

1,3259 

3,7314 

144,60 

1,378 

826,16 

6,3469 

1,4918 

1,6398 

1988 

0,7841 

1,2306 

3,7314 

128,17 

2,273 

734,52 

6,1370 

1,4643 

1,7813 

1989 

0,7919 

1,1842 

3,7673 

138,07 

2,461 

674,13 

6,4559 

1,6369 

1,6382 

1990 

0,7807 

1,1668 

4,7921 

145,00 

2,813 

710,64 

5,9231 

1,3901 

1,7841 

1991 

0,7787 

1,1460 

5,3337 

1 34,59 

3,018 

736,73 

6,0521 

1,4356 

1,7674 

1992 

0,7352 

1,2085 

5,5206 

126,78 

3,095 

784,66 

5,8258 

1,4064 

1,7663 

1993 

0,6799 

1,2902 

5,7795 

111,08 

3,116 

805,75 

7,7956 

1,4781 

1,5016 

1994 

0,7316 

1,3664 

8,6397 

102,18 

3,385 

806,93 

7,7161 

1,3667 

1,5319 

1995 

0,7407 

1,3725 

8,3700 

93,96 

6,447 

772,69 

7,1406 

1,1812 

1,5785 

1996 

0,7828 

1,3638 

8,3389 

108,78 

7,600 

805,00 

6,7082 

1,2361 

1,5607 

1997 

0,7437 

1,3849 

8,3193 

121,06 

7,918 

953,19 

7,6446 

1,4514 

1,6376 

1998 

0,6291 

1,4836 

8,3008 

1 30,99 

9,152 

1.400,40 

7,9522 

1,4506 

1,6573 

1999 

0,6454 

1,4858 

8,2783 

113,73 

9,553 

1.189,84 

8,2740 

1,5045 

1,6172 

2000 

0,5815 

1,4855 

8,2784 

107,80 

9,459 

1.130,90 

9,1735 

1,6904 

1,5156 

2001 

0,5169 

1,5487 

8,2770 

121,57 

9,337 

1.292,02 

10,3425 

1,6891 

1,4396 

2002 

0,5437 

1,5704 

8,2771 

125,22 

9,663 

1.250,31 

9,7233 

1,5567 

1,5025 

2003 

0,6524 

1,4008 

8,2772 

115,94 

10,793 

1.192,08 

8,0787 

1,3450 

1,6347 

2004 

0,7365 

1,3017 

8,2768 

108,15 

11,290 

1.145,24 

7,3480 

1,2428 

1,8330 

2005 

0,7627 

1,2115 

8,1936 

110,11 

10,894 

1.023,75 

7,4710 

1,2459 

1,8204 

2006 

0,7535 

1,1340 

7,9723 

116,31 

10,906 

954,32 

7,3718 

1,2532 

1,8434 


Fonte: Economic Report of The President, 2007, Table B-l 10, p. 356. 


17 Subtraia do IPC do ano corrente o IPC do ano anterior, divida a diferenija pelo IPC do ano anterior e multiplique 
o resultado por 100. Assim, a taxa de inflagao do Canada em 1981 foi de [(85,6 - 76,1)/76,1] x 100 = 12,48%, 
aproximadamente. 
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a. Represente graficamente a evolu^ao das taxas de cambio ao longo do tempo e comente 
sobre o comportamento geral dessa evokujao. 

b. Diz-se que o dolar apreciou-se quando pode comprar mais unidades de moeda estrangeira. 
Opostamente, diz-se que se depreciou quando compra menos unidades da moeda estran¬ 
geira. No perfodo 1985-2006, qual foi o comportamento geral do dolar dos Estados Uni- 
dos? Aproveite para pesquisar em algum livro de macroeconomia ou de economia 
internacional os fatores que determinam a aprecia£ao ou depreciagao de uma moeda. 

1.4. A Tabela 1.5 apresenta os dados relativos a oferta monetaria, no conceito de Ml, que aparecem 
na Figura 1.5. Voce poderia apresentar razoes para o aumento da oferta de moeda no periodo 
considerado? 


TABELA 1.5 

1959:01 

138,8900 

139,3900 

139,7400 

139,6900 

140,6800 

141,1700 

Oferta monetaria 
ajustada, no conceito 
de Ml: janeiro de 

1959 a julho de 1999 

1959:07 

1960:01 

1960:07 

141,7000 

1 39,9800 
140,1800 

141,9000 

139,8700 

141,3100 

141,0100 

139,7500 

141,1800 

140,4700 

139,5600 

140,9200 

140,3800 

139,6100 

140,8600 

139,9500 

139,5800 

140,6900 

(em bilhoes de 

1961:01 

141,0600 

141,6000 

141,8700 

142,1300 

142,6600 

142,8800 

dolares) 

1961:07 

142,9200 

143,4900 

143,7800 

144,1400 

144,7600 

145,2000 

Fonte: Board of Governors, 

1962:01 

145,2400 

145,6600 

145,9600 

146,4000 

146,8400 

146,5800 

Federal Reserve Bank, 
Estados Unidos. 

1962:07 

146,4600 

146,5700 

146,3000 

146,7100 

147,2900 

147,8200 


1963:01 

148,2600 

148,9000 

149,1700 

149,7000 

150,3900 

150,4300 


1963:07 

151,3400 

151,7800 

151,9800 

152,5500 

153,6500 

153,2900 


1964:01 

153,7400 

154,3100 

154,4800 

154,7700 

155,3300 

155,6200 


1964:07 

156,8000 

157,8200 

158,7500 

159,2400 

159,9600 

160,3000 


1965:01 

160,7100 

160,9400 

161,4700 

162,0300 

161,7000 

162,1900 


1965:07 

163,0500 

163,6800 

164,8500 

165,9700 

166,7100 

167,8500 


1966:01 

169,0800 

169,6200 

170,5100 

171,8100 

171,3300 

171,5700 


1966:07 

170,3100 

170,8100 

171,9700 

171,1600 

171,3800 

172,0300 


1967:01 

171,8600 

1 72,9900 

174,8100 

174,1700 

175,6800 

1 77,0200 


1967:07 

178,1300 

179,7100 

180,6800 

181,6400 

182,3800 

183,2600 


1968:01 

184,3300 

184,7100 

185,4700 

186,6000 

187,9900 

189,4200 


1968:07 

190,4900 

191,8400 

192,7400 

194,0200 

196,0200 

197,4100 


1969:01 

198,6900 

199,3500 

200,0200 

200,7100 

200,8100 

201,2700 


1969:07 

201,6600 

201,7300 

202,1000 

202,9000 

203,5700 

203,8800 


1970:01 

206,2200 

205,0000 

205,7500 

206,7200 

207,2200 

207,5400 


1970:07 

207,9800 

209,9300 

211,8000 

212,8800 

21 3,6600 

214,4100 


1971:01 

215,5400 

217,4200 

218,7700 

220,0000 

222,0200 

223,4500 


1971:07 

224,8500 

225,5800 

226,4700 

227,1600 

227,7600 

228,3200 


1972:01 

230,0900 

232,3200 

234,3000 

235,5800 

235,8900 

236,6200 


1972:07 

238,7900 

240,9300 

243,1800 

245,0200 

246,4100 

249,2500 


1973:01 

251,4700 

252,1500 

251,6700 

252,7400 

254,8900 

256,6900 


1973:07 

257,5400 

257,7600 

257,8600 

259,0400 

260,9800 

262,8800 


1974:01 

263,7600 

265,3100 

266,6800 

267,2000 

267,5600 

268,4400 


1974:07 

269,2700 

270,1200 

271,0500 

272,3500 

273,7100 

274,2000 


1975:01 

273,9000 

275,0000 

276,4200 

276,1700 

279,2000 

282,4300 


1975:07 

283,6800 

284,1500 

285,6900 

285,3900 

286,8300 

287,0700 


1976:01 

288,4200 

290,7600 

292,7000 

294,6600 

295,9300 

296,1600 


1976:07 

297,2000 

299,0500 

299,6700 

302,0400 

303,5900 

306,2500 


( Continua ) 
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TABELA 1.5 

1977:01 

308,2600 

311,5400 

(Continuagao) 

1977:07 

320,1900 

322,2700 


1978:01 

334,4000 

335,3000 


1978:07 

347,6300 

349,6600 


1979:01 

358,6000 

359,9100 


1959:01 

1 38,8900 

139,3900 


1959:07 

141,7000 

141,9000 


1960:01 

1 39,9800 

139,8700 


1960:07 

140,1800 

141,3100 


1961:01 

141,0600 

141,6000 


1961:07 

142,9200 

143,4900 


1962:01 

145,2400 

145,6600 


1962:07 

146,4600 

146,5700 


1963:01 

148,2600 

148,9000 


1963:07 

151,3400 

151,7800 


1964:01 

153,7400 

154,3100 


1964:07 

156,8000 

157,8200 


1965:01 

160,7100 

160,9400 


1965:07 

163,0500 

163,6800 


1966:01 

169,0800 

169,6200 


1966:07 

170,3100 

170,8100 


1967:01 

171,8600 

1 72,9900 


1967:07 

178,1300 

179,7100 


1968:01 

184,3300 

184,7100 


1968:07 

190,4900 

191,8400 


1969:01 

198,6900 

199,3500 


1969:07 

201,6600 

201,7300 


1970:01 

206,2200 

205,0000 


1970:07 

207,9800 

209,9300 


1971:01 

215,5400 

21 7,4200 


1971:07 

224,8500 

225,5800 


1972:01 

230,0900 

232,3200 


1972:07 

238,7900 

240,9300 


1973:01 

251,4700 

252,1500 


1973:07 

257,5400 

257,7600 


1974:01 

263,7600 

265,3100 


1974:07 

269,2700 

270,1200 


1975:01 

273,9000 

275,0000 


1975:07 

283,6800 

284,1500 


1976:01 

288,4200 

290,7600 


1976:07 

297,2000 

299,0500 


313,9400 

316,0200 

317,1900 

318,7100 

324,4800 

326,4000 

328,6400 

330,8700 

336,9600 

339,9200 

344,8600 

346,8000 

352,2600 

353,3500 

355,4100 

357,2800 

362,4500 

368,0500 

369,5900 

373,3400 

139,7400 

1 39,6900 

140,6800 

141,1700 

141,0100 

140,4700 

140,3800 

139,9500 

139,7500 

139,5600 

139,6100 

139,5800 

141,1800 

140,9200 

140,8600 

140,6900 

141,8700 

142,1300 

142,6600 

142,8800 

143,7800 

144,1400 

144,7600 

145,2000 

145,9600 

146,4000 

146,8400 

146,5800 

146,3000 

146,7100 

147,2900 

147,8200 

149,1700 

149,7000 

150,3900 

150,4300 

151,9800 

152,5500 

153,6500 

153,2900 

154,4800 

154,7700 

155,3300 

155,6200 

158,7500 

159,2400 

159,9600 

160,3000 

161,4700 

162,0300 

161,7000 

162,1900 

164,8500 

165,9700 

166,7100 

167,8500 

170,5100 

171,8100 

171,3300 

171,5700 

171,9700 

171,1600 

171,3800 

172,0300 

174,8100 

1 74,1 700 

175,6800 

177,0200 

180,6800 

181,6400 

182,3800 

183,2600 

185,4700 

186,6000 

187,9900 

189,4200 

192,7400 

194,0200 

196,0200 

197,4100 

200,0200 

200,7100 

200,8100 

201,2700 

202,1000 

202,9000 

203,5700 

203,8800 

205,7500 

206,7200 

207,2200 

207,5400 

211,8000 

212,8800 

213,6600 

214,4100 

218,7700 

220,0000 

222,0200 

223,4500 

226,4700 

227,1600 

227,7600 

228,3200 

234,3000 

235,5800 

235,8900 

236,6200 

243,1800 

245,0200 

246,4100 

249,2500 

251,6700 

252,7400 

254,8900 

256,6900 

257,8600 

259,0400 

260,9800 

262,8800 

266,6800 

267,2000 

267,5600 

268,4400 

271,0500 

272,3500 

273,7100 

274,2000 

276,4200 

276,1700 

279,2000 

282,4300 

285,6900 

285,3900 

286,8300 

287,0700 

292,7000 

294,6600 

295,9300 

296,1600 

299,6700 

302,0400 

303,5900 

306,2500 
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TABELA 1.5 

1977:01 

308,2600 

311,5400 

( Continuagao ) 

1977:07 

320,1900 

322,2700 


1978:01 

334,4000 

335,3000 


1978:07 

347,6300 

349,6600 


1979:01 

358,6000 

359,9100 


1979:07 

377,2100 

378,8200 


1980:01 

385,8500 

389,7000 


1980:07 

394,9100 

400,0600 


1981:01 

410,8300 

414,3800 


1981:07 

427,9000 

427,8500 


1982:01 

442,1300 

441,4900 


1982:07 

449,0900 

452,4900 


1983:01 

476,6800 

483,8500 


1983:07 

508,9600 

511,6000 


1984:01 

524,4000 

526,9900 


1984:07 

542,1300 

542,3900 


1985:01 

555,6600 

562,4800 


1985:07 

590,8200 

598,0600 


1986:01 

620,4000 

624,1400 


1986:07 

672,2000 

680,7700 


1987:01 

729,3400 

729,8400 


1987:07 

744,9600 

746,9600 


1988:01 

755,5500 

757,0700 


1988:07 

783,4000 

785,0800 


1989:01 

784,9200 

783,4000 


1989:07 

779,7100 

781,1400 


1990:01 

794,9300 

797,6500 


1990:07 

811,8000 

817,8500 


1991:01 

826,7300 

832,4000 


1991:07 

862,9500 

868,6500 


1992:01 

910,4900 

925,1300 


1992:07 

964,6000 

975,7100 


1993:01 

1030,900 

1033,150 


1993:07 

1085,880 

1095,560 


1994:01 

1132,200 

1136,130 


1994:07 

1151,490 

1151,390 


1995:01 

1150,640 

1146,740 


1995:07 

1146,500 

1146,100 


1996:01 

1122,580 

1117,530 


1996:07 

1112,340 

1102,180 


1997:01 

1080,520 

1076,200 


313,9400 

316,0200 

317,1900 

318,7100 

324,4800 

326,4000 

328,6400 

330,8700 

336,9600 

339,9200 

344,8600 

346,8000 

352,2600 

353,3500 

355,4100 

357,2800 

362,4500 

368,0500 

369,5900 

373,3400 

379,2800 

380,8700 

380,8100 

381,7700 

388,1300 

383,4400 

384,6000 

389,4600 

405,3600 

409,0600 

410,3700 

408,0600 

418,6900 

427,0600 

424,4300 

425,5000 

427,4600 

428,4500 

430,8800 

436,1700 

442,3700 

446,7800 

446,5300 

447,8900 

457,5000 

464,5700 

471,1200 

474,3000 

490,1800 

492,7700 

499,7800 

504,3500 

513,4100 

517,2100 

518,5300 

520,7900 

530,7800 

534,0300 

536,5900 

540,5400 

543,8600 

543,8700 

547,3200 

551,1900 

565,7400 

569,5500 

575,0700 

583,1700 

604,4700 

607,9100 

611,8300 

619,3600 

632,8100 

640,3500 

652,0100 

661,5200 

688,5100 

695,2600 

705,2400 

724,2800 

733,0100 

743,3900 

746,0000 

743,7200 

748,6600 

756,5000 

752,8300 

749,6800 

761,1800 

767,5700 

771,6800 

779,1000 

784,8200 

783,6300 

784,4600 

786,2600 

782,7400 

778,8200 

774,7900 

774,2200 

782,2000 

787,0500 

787,9500 

792,5700 

801,2500 

806,2400 

804,3600 

810,3300 

821,8300 

820,3000 

822,0600 

824,5600 

838,6200 

842,7300 

848,9600 

858,3300 

871,5600 

878,4000 

887,9500 

896,7000 

936,0000 

943,8900 

950,7800 

954,7100 

988,8400 

1004,340 

1016,040 

1024,450 

1037,990 

1 047,470 

1066,220 

1075,610 

1105,430 

111 3,800 

1123,900 

1129,310 

1139,910 

1141,420 

1142,850 

1145,650 

1152,440 

1150,410 

1150,440 

1149,750 

1146,520 

1149,480 

1144,650 

1144,240 

1142,270 

1136,430 

1133,550 

1126,730 

1122,590 

1124,520 

1116,300 

1115,470 

1095,610 

1082,560 

1080,490 

1081,340 

1072,420 

1067,450 

1063,370 

1065,990 
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TABELA 1.5 

1997:07 

1067,570 

1072,080 

1064,820 

1062,060 

1067,530 

1074,870 

(Continuagao) 

1998:01 

1073,810 

1076,020 

1080,650 

1082,090 

1078,170 

1077,780 


1998:07 

1075,370 

1072,210 

1074,650 

1080,400 

1088,960 

1093,350 


1999:01 

1091,000 

1092,650 

1102,010 

1108,400 

1104,750 

1101,110 


1999:07 

1099,530 

1102,400 

1093,460 





1.5. Suponha que voce quisesse desenvolver um modelo economico de atividades criminosas, 
como as horas gastas nessas atividades (por exemplo, a venda de drogas ilegais). Que variaveis 
consideraria? Verifique se seu modelo combina com o desenvolvido pelo economista ganhador 
do Nobel Gary Becker. 18 

1.6. Experiments controlados de economia: em 7 de abril de 2000, o presidente Clinton sancionou 
uma lei aprovada pelo Congresso que eliminava as restr^oes aos ganhos dos beneficiarios da 
Previdencia Social. Ate entao, os beneficiarios com idade entre 65 e 69 anos que ganhassem 
mais de $ 17 mil ao ano perderiam o equivalente a $ 1 do beneficio para cada $ 3 ganhos alem 
daqueles $ 17 mil. Como voce conceberia um estudo visando avaliar o impacto dessa mudanga 
legal? Nota: na lei antiga, nao havia nenhuma limitac^ao de renda para os beneficiarios com 
mais de 70 anos. 

1.7. Os dados apresentados na Tabela 1.6 foram divulgados na edi?ao do The Wall Street Journal 
de 1° de mar 50 de 1984. Relacionam o o^amento de publicidade (em milhoes de dolares) de 


TABELA 1.6 

Impacto das 
despesas com 
publicidade 

Fonte: Dispomvel em: 
http://lib.start.cmu. edu/ 
DASL/Datafiles/tvadsdat. 
html. 


Empresa 

Impressao 
(em milhoes) 

Desf 

(em milhoes de 

1. Miller Lite 

32,1 

50,1 

2. Pepsi 

99,6 

74,1 

3. Stroh's 

11,7 

19,3 

4. Fed'l Express 

21,9 

22,9 

5. Burger King 

60,8 

82,4 

6. Coca Cola 

78,6 

40,1 

7. McDonald's 

92,4 

185,9 

8. MCI 

50,7 

26,9 

9. Diet Cola 

21,4 

20,4 

10. Ford 

40,1 

166,2 

11. Levi's 

40,8 

27,0 

12. Bud Lite 

10,4 

45,6 

1 3. ATT/Bell 

88,9 

154,9 

14. Calvin Klein 

12,0 

5,0 

15. Wendy's 

29,2 

49,7 

16. Polaroid 

38,0 

26,9 

1 7. Shasta 

10,0 

5,7 

18. Meow Mix 

12,3 

7,6 

19. Oscar Meyer 

23,4 

9,2 

20. Crest 

71,1 

32,4 

21. Kibbles 'N Bits 

4,4 

6,1 


18 BECKER, C. S. "Crime and punishment: an economic approach". Journal of Political Economy, 1968. v. 76, 
p. 169-217. 
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21 empresas em 1983 com as impressoes retidas, semanalmente, pelos que viram os produtos 
anunciados por essas empresas. Os dados foram obtidos em uma pesquisa realizada com 4 mil 
adultos, em que foi pedido aos usuarios dos produtos que citassem um comercial da categoria 
do produto que tivessem assistido na semana anterior. 

a. Trace um grafico com as impressoes no eixo vertical e os gastos com publicidade no eixo 
horizontal. 

b. O que voce poderia dizer sobre a natureza da relac^ao entre as duas variaveis? 

c. Examinando o grafico, voce acha que vale a pena anunciar? Pense em todos os comerciais 
veiculados em finais de campeonatos de esportes ou no horario nobre. 

Nota\ nos proximos capftulos exploraremos mais os dados da Tabela 1.6. 


Capitulo 

Analise de regressao com 
duas variaveis: algumas 
ideias basicas 

No Capitulo 1, examinamos o conceito de regressao em termos gerais. Neste, trataremos o as- 
sunto de maneira mais formal. Especificamente, aqui e nos tres capitulos seguintes, apresentaremos 
ao leitor a teoria que fundamenta a analise de regressao mais simples possrvel, isto e, a regressao 
bivariada, ou com duas variaveis, na qual a variavel dependente (regressando) se relaciona a uma 
unica variavel explanatoria (regressor). Esse caso e considerado primeiro, nao por ser mais pratico, 
mas porque apresenta as ideias fundamentais da analise de regressao da maneira mais simples pos¬ 
sivel e alguns desses conceitos podem ser ilustrados com graficos bidimensionais. Alem disso, 
como veremos, a analise de regressao multipla, mais geral, em que o regressando se relaciona a um 
ou mais regressores e, sob muitos aspectos, uma extensao logica do caso de duas variaveis. 

2.1 Um exemplo hipotetico 1 

Como observado na Se§ao 1.2, a analise de regressao trata, em grande parte, da estima 5 ao e/ou previ- 
sao do valor medio (para a populacjao) da variavel dependente com base nos valores conhecidos, ou fixa- 
dos, da variavel explanatoria. 2 Para melhor entender, considere os dados da Tabela 2.1. Eles se referem a 
uma populacao total de 60 famflias de uma comunidade hipotetica e sua renda (X) e despesas de consu- 
mo (Y) semanais, ambas medidas em dolares. As 60 famflias foram divididas em dez grupos de renda 
(de $ 80 a $ 260) e as despesas semanais de cada familia nos varios grupos sao apresentadas na tabela. 
Portanto, temos dez valores fixados de X e os valores correspondentes de Y para cada um dos valores de 
X. Entao, podemos dizer que ha dez subpopula 5 oes de Y. 

Existe uma variayao consideravel nas despesas de consumo semanais dentro de cada grupo de 
renda, o que pode ser visto claramente na Figura 2.1. Mas de modo geral observa-se que, a despeito da 
variabilidade dos gastos semanais de consumo em cada classe de renda, as despesas aumentam, em 
media, com o aumento da renda. Para facilitarmos o entendimento, na Tabela 2.1 apresentamos o gas- 
to de consumo medio de cada uma das dez classes de renda. Para um nivel de renda semanal de $ 80, 
as despesas de consumo medias sao de $ 65, enquanto, para um nivel de renda de $ 200, sao de $ 137. 
Ao todo, temos dez valores medios para as dez subpopula£6es de Y. Chamamos esses valores medios 
de valores esperados condicionais, pois dependent dos valores dados da variavel condicionante X. 



1 O leitor que considera seus conhecimentos estatfsticos um tanto enferrujados pode atualiza-los com a leitura do 
Apendice A estatfstico antes de ler este capitulo. 

2 O valor esperado, ou esperanpa, ou media populacional de uma variavel aleatoria Ye denotado pelo sfmbolo E(Y). 
Por outro lado, o valor medio calculado com base nos valores de uma amostra da populacao Y e repre- 
sentado como Y, que se le como "Y barra". 
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Simbolicamente, sao denotados como E(Y/X), que se le como “valor esperado de Y dado o valor de X ” 
(veja tambem a Tabela 2.2). 

E importante distinguir esses valores esperados condicionais dos valores esperados incondicionais das 
despesas semanais de consumo, E(Y). Se somarmos as despesas de consumo semanais das 60 famf- 
lias da populagao e dividirmos esse total por 60, obteremos o numero $ 121,20 ($ 7.272/60), que e 
a media incondicional, ou esperada, das despesas de consumo semanais, E(Y); e incondicional no 
sentido de que, para chegar a esse total, desconsideramos a classe de renda das varias famflias. 3 Obvia- 
mente, os diversos valores esperados condicionais de Y fornecidos na Tabela 2.1 sao diferentes do valor 
esperado incondicional de Y, $ 121,20. Quando perguntamos: “Qual o valor esperado das despesas de 
consumo semanais medias de uma familia?”, obtemos a resposta $ 121,20 (a media incondicional). 
Mas se perguntarmos: “Qual o valor esperado das despesas de consumo semanais de uma famflia cuja 
renda mensal e de $ 140?”, a resposta sera $ 101 (a media condicional). Em outras palavras, se pergun- 
tassemos: “Qual a melhor previsao (media) das despesas semanais de familias com uma renda sema- 
nal de $ 140?”, a resposta seria $101. Conhecer a classe de renda pode nos permitir prever melhor o 
valor medio das despesas de consumo do que se nao tivermos esse dado. 4 Esta, provavelmente, e a 
essencia da analise de regressao, como descobriremos ao longo do livro. 


TABELA 2.1 

Renda familiar 
semanal, X, em $ 


X-+ 

80 

100 

120 

140 

160 

180 

200 

220 

240 

260 

Despesas de 

55 

65 

79 

80 

102 

110 

120 

135 

137 

150 

consumo 

60 

70 

84 

93 

107 

115 

136 

137 

145 

152 

semanais 

65 

74 

90 

95 

110 

120 

140 

140 

155 

175 

das famflias, 

70 

80 

94 

103 

116 

130 

144 

152 

165 

178 

Y, em $ 

75 

85 

98 

108 

118 

135 

145 

157 

175 

180 


- 

88 

- 

113 

125 

140 

- 

160 

189 

185 


- 

- 

- 

115 

- 

- 

- 

162 

- 

191 

Total 

325 

462 

445 

707 

678 

750 

685 

1043 

966 

1211 

Medias 

condicionais de Y, 
E(Y\X) 

65 

77 

89 

101 

113 

125 

137 

149 

161 

173 


FIGURA 2.1 

Distribui§ao 
condicional das 
despesas para varios 
nrveis de renda (dados 
da Tabela 2.1). 



3 Conforme mostrado no Apendice A, em geral, os valores das medias condicionais e incondicionais sao diferentes. 
4 Devo a James Davidson esta perspectiva. Veja DAVIDSON, James. Econometric theory. Oxford, R. U.: Blackwell 
Publishers, 2000. p. 11. 
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TABELA 2.2 

Probabilidades 
condicionais p(Y I X,) 
dos dados da 
Tabela 2.1 


FIGURA 2.2 

Linha de regressao 
populacional (dados 
da Tabela 2.1). 



Na Figura 2.1, os pontos pretos circulados mostram os valores medios condicionais de Y para os 
diversos valores de X. Se unirmos os valores medios condicionais obteremos o que e conhecido 
como linha de regressao populacional (LRP) ou, de modo mais geral, a curva de regressao po- 
pulacionaP. Simplificando, e a regressao de Y contra X. O qualificativo “populacional” expressa o 
fato de que neste exemplo estamos lidando com toda a popula§ao de 60 famflias. Na realidade, uma 
popula§ao tem muito mais famflias. 

Em termos geometricos, uma curva de regressao populacional e apenas o local geometrico das medias 
condicionais da variavel dependente para os valores fixados da(s) variavel(is) explanatoria(s). De modo 
mais simples, e a curva que conecta as medias das subpopula^oes de Y correspondentes aos 
valores dados do regressor X. A Figura 2.2 ilustra a definifjao. 

Essa figura mostra que, para cada X (isto e, nfvel de renda), ha uma populafao de valores 
de Y (despesas de consumo semanais) que se espalham em torno da media (condicional) desses 
valores de Y. Para simplificarmos, pressupomos que esses valores de Y distribuem-se simetri- 
camente em torno de seus respectivos valores medios (condicionais) e que a linha (ou curva) 
passa por esses valores medios (condicionais). 


Y 



Renda semanal (em $) 


5 No presente exemplo, a LRP e uma linha reta, mas tambem poderia ser uma curva (veja a Figura 2.3). 
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Com essa referenda em mente, talvez seja interessante ao leitor reler a definigao de regressao 
dada na Segao 1.2. 

2.2 Conceito de fungao de regressao populacional (FRP) 

Do que foi dito anteriormente e das Figuras 2.1 e 2.2, fica claro que cada media condicional 
E(Y I Xft e uma fungao de X r em que X t e um dado valor de X. Simbolicamente, 

E(Y | Xft = f(Xft (2.2.1) 

em que/(2Q representa uma fungao da variavel explanatoria X. Em nosso exemplo, E(Y I Xft e uma 
fungao linear de X r A Equagao (2.2.1) e conhecida como a fungao de esperanga condicional (FEC) 
ou fungao de regressao populacional (FRP) ou, resumidamente, regressao populacional (RP). Ela 
afirma que o valor esperado da distribuigao de Y, dado X h tem uma relagao funcional com X,. Ou seja, 
a resposta media de Y varia com X. 

Qual e a forma assumida pela fungao /(A",)? Essa e uma pergunta importante, porque em situagoes 
reais nao temos a populagao inteira disponlvel para examinar. A forma funcional da FRP e, portanto, uma 
questao empirica, embora em casos especificos a teoria tenha algo a dizer. Por exemplo, um economista 
poderia postular que a despesa de consumo tem uma relagao linear com a renda. Como primeira aproxi- 
magao, ou hipotese de trabalho, podemos supor que a FRP E(Y I Xj) e uma fungao linear de X l do tipo 

E{Y \X i ) = p l +p 2 X i (2.2.2) 

em que ft x e ft 2 sao parametros desconhecidos, mas fixos, chamados de coeficientes de regressao; 
ft x e ft 2 tambem sao conhecidos como intercepto e coeficiente angular, respectivamente. A 
Equagao (2.2.1) e conhecida como fungao linear de regressao populacional. Algumas ex- 
pressoes altemativas usadas na literatura sao: modelo linear de regressao populacional ou regressao 
linear populacional. A partir de agora, as expressoes regressao, equagao de regressao e modelo de 
regressao serao usadas como sinonimos. 

Na analise de regressao, nosso interesse esta em estimar fungoes de regressao populacional como 
a Equagao (2.2.2), isto e, estimar os valores de incognitas como ft] e fti com base nas observagoes de 
Y eX. Esse topico sera visto em detalhe no Capftulo 3. 


2.3 O sigiiificado do terino linear 

Como este livro trata principalmente dos modelos lineares como a Equagao (2.2.2), e essencial conhe- 
cer qual o verdadeiro significado do termo linear, pois pode ser interpretado de duas maneiras diferentes. 

Linearidade nas variaveis 

O primeiro, e talvez o significado mais “natural” de linearidade, e o caso em que a expecta- 
tiva condicional de Y e uma fungao linear de X h como, por exemplo, a Equagao (2.2.2). 6 Em 
termos geometricos, a curva de regressao nesse caso e uma reta. Sob essa interpretagao, uma 
fungao de regressao como E(Y I Xft = ft x + ft 2 X j nao e uma fungao linear, porque a variavel 
X aparece com um expoente ou l'ndice de 2. 


6 Diz-se que uma fungao Y = f (X) e linear em X, se X tiver um expoente ou fndice de 1 (isto e, termos como X 2 , 
ftx e assim por diante estao exclufdos) e nao estiver multiplicado ou dividido por qualquer outra variavel (por 
exemplo, X ■ Z ou X/Z, em que Z e outra variavel). Se Y depende apenas de X, outra maneira de dizer que Y 
se relaciona linearmente com X e que a taxa de variagao de Y em relagao a X (isto e, a inclinagao, ou derivada, 
de Y com relagao a X, dY/dX) independe do valor de X. Assim, se / = 4X, dY/dX = 4, que e independente do 
valor de X. Mas se Y= 4X 2 , dY/dX = 8X, que nao e independente do valor assumido por X. Nesse caso, a fungao 
nao e linear em X. 
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Linearidade nos parametros 

A segunda interpretagao de linearidade e que a expectativa condicional de Y, E(Y I Xj), e uma 
fungao linear dos parametros, os ft; pode, ou nao, ser linear na variavel X. 1 De acordo com essa in¬ 
terpretagao, E( Y I X j) = ft } + ft 2 X? e um modelo de regressao linear (nos parametros). Para ver isto, 
suponhamos que X assuma o valor 3. Portanto, E(Y I X = 3) = ft\ + 9ft 2 , que e obviamente linear em 
fti e /3 2 -Todos os modelos da Figura 2.3 sao, portanto, modelos de regressao linear, isto e, modelos 
lineares nos parametros. 

Agora considere o modelo E(Y I X,) = ft l + ft\X r Suponha que X = 3; entao teremos 
E(Y I Xj) = ft\ + 3ft 2 , que e nao-linear no parametro ft 2 . Esse modelo e um exemplo de modelo de 
regressao nao-linear (nos parametros). Examinaremos tais modelos no Capftulo 14. 

Das duas interpretagoes de linearidade, a linearidade nos parametros e a relevante para a formu- 
lagao da teoria da regressao que apresentaremos em breve. De agora em diante, a expressao regres¬ 
sao “linear” significara sempre uma regressao linear nos parametros; os ft (isto e, os parametros) sao 
elevados apenas a primeira potencia. Podem ou nao ser lineares nas variaveis explanatorias, os X. Na 
Tabela 2.3, mostramos isso esquematicamente. Assim, E(Y I X,) = ft\ + ft 2 X h que e linear tanto 
nos parametros quanto na variavel, e um modelo de regressao linear (MRL), assim como E( Y I Xj) = 
fti + ft 2 X f, que e linear nos parametros, mas nao na variavel X. 


FIGURA 2.3 

Fungoes lineares nos 
parameU'os. 


Y 


Y 



Y= p { + p 2 X+ p 3 X 2 


Y 


Exponencial 

Y=eP i + P2 x 


X 


X 




Y= p l + p 2 x + p 3 x 2 + p 4 x 3 

- X 


TABELA 2.3 

Modelos de regressao 
linear 


Modelo linear nos parametros? 

Modelo linar nas variaveis? 


Sim 

Nao 

Sim 

MRL 

MRL 

Nao 

MRNL 

MRNL 


Nota: MRL = Modelo de Regressao Linear 

MRNL = Modelo de Regressao Nao Linear 


7 Diz-se que uma fungao e linear no parametro p 3 , se fa so aparece com um expoente 1 e nao esta multiplicado 
ou dividido por nenhum outro parametro (por exemplo, P 1 P 2 , P 2 /P 1 e assim por diante). 
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2.4 Especifica^ao estocastica da FRP 

A Figura 2.1 deixa claro que a medida que a renda familiar aumenta, em media, as despesas de 
consumo das famflias aumentam. Mas o que acontece com as despesas de consumo de uma famflia 
em relagao ao nivel (fixado) de sua renda? A Tabela 2.1 e a Figura 2.1 mostram que as despesas de 
consumo de uma famflia nao aumentam necessariamente quando aumenta seu rn'vel de renda. Por 
exemplo, na Tabela 2.1, observamos que ha uma famflia, com um nivel de renda de $ 100, cuja des- 
pesa de consumo de $ 65 e menor que as despesas de consumo de duas outras famflias cuja renda 
semanal e de apenas $ 80. Mas observe que as despesas medias de consumo das famflias com renda se- 
manal de $ 100 sao maiores que as despesas medias das famflias cuja renda semanal e de $ 80 
($ 77 comparados a $ 65). 

O que podemos dizer sobre a relagao entre as despesas de consumo de uma famflia e um nivel de 
renda? Vemos na Figura 2.1 que para um nivel de renda X ,• as despesas medias de consumo de uma 
famflia agrupam-se em torno do consumo medio de todas as famflias deste nivel X b isto e, em torno 
de sua esperanga condicional. Portanto, podemos expressar o desvio individual de 1) em torno de seu 
valor esperado como a seguir: 


Ui = Y t - E(Y | X.) 
ou 

Yi = E(Y \X,) + Ui ( 2 . 4 . 1 ) 

em que o desvio m, e uma variavel aleatoria nao-observavel que assume valores positivos ou negati- 
vos. Tecnicamente, «, e conhecida como disturbio estocastico ou termo de erro estocastico. 

Como interpretamos a Equagao 2.4.1? Podemos dizer que a despesa de consumo de uma 
famflia individual, dado seu ntvel de renda, node ser expressa como a soma de dois comoonen- 
tes' 11) E(Y I XX que e simnlesmente o gasto medio em consumo de todas as famflias com o 
mesmo ntvel de renda (esse comoonente e conhecido como sistematico ou determimstico): e 
(?) U;, que e o componente aleatorio ou nao-sistematico, Examinaremos em breve a natureza do 
termo disturbio estocastico, mas. no momento. sunoremos que seia um substitute) ou represen- 
tonte (proxy) de todas as variaveis omitidas ou negjigenciadas que oodem afetar Y. mas nao fo- 
ram lou nao nuderam serf inclutdas no modelos de regressao. 

Se supomos que E(Y I X) e linear em X b como na Equagao (2.2.2), a Equagao (2.4.1) pode 
ser escrita da seguinte maneira: 


Y, = E(Y | Xi) + m 

= Pl+P2Xi+Ui ( 2 - 4 - 2 ) 

A Equagao (2.4.2) informa que as despesas de consumo de uma famflia relacionam-se linearmente com 
sua renda mais o termo de erro estocastico. Assim, as despesas de consumo individuais, dado X = $ 80 
(veja a Tabela 2.1), podem ser expressas como: 

Ti = 55 = Pi + 02(80) + u\ 

Y2 — 60 = 0\ + 02(80) + U2 
Y3 — 65 — 0\ + 02(80) + M3 
Y 4 — 70 = 0\ + 02(80) + U 4 
Y 5 — 75 — 0i + 02(80) + M 5 


( 2 . 4 . 3 ) 



Capftulo 2 Analise de regressao com duas variaveis: algiimas ideias bdsicas 65 


Agora, se tomarmos o valor esperado de (2.4.1) nos dois lados da equa^ao, obtemos: 

E(Y, | Xt) = E[E(Y | X,)] + E( Ui \ X t ) 

= E(.Y\X i ) + E{u i \X i ) ( Z4 - * 1 2 3 4 * * * > 

em que levamos em considera 9 ao o fato de que o valor esperado de uma constante e a propria constante. 8 
Observe atentamente que, na Equa?ao 2.4.4, tomamos a esperan 9 a condicional condicionada a mu dado X. 
Como E(Y) I Xj) e o mesmo que E(Y I X,), a Equa^ao (2.4.4) implica que 


E(ui | X,) = 0 (2.4.5) 

Assim, a suposigao de que a linha de regressao passa pelas medias condicionais de Y (veja a Figura 
2.2) implica que os valores medios condicionais de u, (condicionados a um dado X) sejam iguais a zero. 

Com base no que foi discutido, e claro que as Equa 9 oes (2.2.2) e (2.4.2) sao formas equivalentes, 
se E(iij I Xj) = 0. 9 Mas a especifica 9 ao estocastica na Equa?ao (2.4.2) tem a vantagem de mostrar cla- 
ramente que ha outras variaveis, alem da renda, que afetam as despesas de consumo e que os gastos de 
consumo de uma famflia nao podem ser completamente explicados apenas pelas variaveis inclui'das 
no modelo de regressao. 


2.5 


O significado do termo “erro estocastico” 


Como observado na Se 9 ao 2.4, o termo de erro u ,■ representa todas as variaveis omitidas no mo¬ 
delo, mas que coletivamente afetam Y. Apergunta obvia e: por que nao introduzir essas variaveis ex- 
plicitamente no modelo? Ou seja, por que nao formular um modelo de regressao com o maximo de 
variaveis possiveis? Ha muitas razoes: 

1. Carater vago da teoria: a teoria, se existe alguma, que explica o comportamento de Y pode ser, e 
muitas vezes e, incompleta. Podemos saber com certeza que a renda semanal X influencia as 
despesas de consumo semanais Y, mas podemos desconhecer ou nao ter certeza de quais sao 
as outras variaveis que afetam Y. Portanto, u, pode ser usado como um substituto para todas as 
variaveis excluidas ou omitidas do modelo. 

2. Indisponibilidade de dados: mesmo se soubermos quais sao algumas das variaveis excluidas e, por¬ 
tanto, considerarmos uma regressao multipla em vez da simples, talvez nao tenhamos informa 9 oes 
quantitativas a respeito dessas variaveis. E muito comum na analise empirica que os dados que 
gostarfamos idealmente de incluir nao estejam disponiveis. Por exemplo, em principio poderiamos 
incluir a riqueza da famflia, alem da renda, como variavel explanatoria para explicar as despesas 
de consumo, mas infelizmente essa informa 9 ao nao costuma estar disponivel. Podemos ser obriga- 
dos a omitir a variavel riqueza de nosso modelo, apesar de sua grande relevancia teorica para expli¬ 
car as despesas de consumo. 

3. Variaveis essenciais versus variaveis perifericas/secimdarias: suponha que, no nosso exemplo de con¬ 
sumo e renda, alem da renda X h o niimero de filhos por famflia X 2 , o genero X } , a religiao X 4 , a 
escolaridade X 5 e a regiao geografica X 6 tambem afetem as despesas de consumo. Mas e bem pos- 
sivel que a influencia conjunta de todas ou de algumas dessas variaveis seja tao pequena e seja, na 
melhor das hipoteses, nao-sistematica ou aleatoria que, em termos praticos e para considera 9 ao de 
custos, nao compense inclui-las explicitamente no modelo. Espera-se que seu efeito combinado 
possa ser tratado como uma variavel aleatoria: w,-. 10 

4. Carater intrinsecamente aleatorio do comportamento humano: mesmo se conseguirmos incluir 

todas as variaveis relevantes no modelo, sempre havera uma aleatoriedade “intrinseca” 


8 Veja o Apendice A, no qual apresentamos uma breve discussao das propriedades do operador esperanga E. 

Observe que E(Y \ X,), uma vez que o valor de X ; e fixo, e uma constante. 

9 A proposito, no metodo dos mfnimos quadrados que examinaremos no Capftulo 3, supoe-se explicitamen¬ 

te que E(Ui\Xi) = 0. Veja a Segao 3.2. 

10 Uma dificuldade adicional e que variaveis como genero, escolaridade e religiao sao diffceis de quantificar. 
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nos Y individuals que nao pode ser explicada por mais que nos esforcemos para tanto. Os termos 
de erro, os u, podem refletir bem a aleatoriedade intrinseca. 

5. Variaveis proxy pouco adequadas: embora o modelo classico de regressao (que sera examinado no 
Capftulo 3) suponha que as variaveis Y e A sejam medidas com exatidao, na pratica os dados podem 
estar infestados de erros de medipao. Veja, por exemplo, a conhecida teoria da funpao consumo de 
Milton Friedman. * 11 Ele considera o consumo pennanente ( Y p ) como uma funpao da rendu perma- 
nente (X p ). Mas, como os dados relativos a essas variaveis nao sao diretamente observaveis, na 
pratica, utilizamos variaveis proxy, como consumo corrente (Y) e renda corrente (X), que sao 
observaveis. Como os Y e X observados podem nao ser iguais aos Y p e X p , ha um problema de erro 
de medipao. Nesse caso, o termo de erro u tambem pode representar erro de medipao. Como veremos 
em um capftulo mais a frente, se existirem tais erros de medipao, eles podem ter serias implicapoes 
na estimativa dos coeficientes da regressao, os /). 

6. Principio da parcimonia: de acordo com a navalha de Occam, 12 o ideal seria formular o modelo de 
regressao mais simples possivel. Se pudermos explicar parte “substantial” do comportamento de Y 
com duas ou tres variaveis explanatorias e se nossa teoria nao for suficientemente forte para 
sugerir quais outras variaveis podem ser incluidas, por que adicionar mais variaveis? Melhor 
deixar que u, represente todas as outras variaveis. Naturalmente, nao deverfamos excluir variaveis 
importantes e relevantes para apenas manter o modelo de regressao simples. 

7. Forma funcional errada: mesmo se as variaveis explanatorias de um fenomeno forem teorica- 

mente corretas e mesmo se encontrarmos dados para essas variaveis, muitas vezes desconhece- 
remos a forma funcional da relapao entre o regressando e os regressores. As despesas de consumo 
serao uma funpao linear (invariavel) da renda ou uma funpao nao-linear (invariavel)? Se for o 
primeiro caso, Y t = + /TA,- + u, sera a relapao funcional apropriada entre Y e X; mas, se for 

o segundo, Y t = + [F X, + + A, 2 + m, pode ser a forma funcional correta. Nos modelos de 

duas variaveis, a forma funcional da relapao pode muitas vezes ser inferida do grafico de dispersao. 
Mas, em um modelo de regressao multipla, nao e facil determinar a relapao funcional adequada, 
pois nao podemos visualizar graficamente diagramas de dispersao com multiplas dimensoes. 

Por todas essas razoes, o termo de erro estocastico m, assume um papel fundamental na analise de 

regressao, como veremos no decorrer do livro. 


2.6 A funpao de regressao amostral (FRA) 


Ate agora, ao limitar nosso exame dos valores de Y correspondentes aos X fixados para a popula¬ 
pao, evitamos deliberadamente quaisquer considerapoes relativas a amostragem (observe que os dados 
da Tabela 2.1 representam a populapao, nao uma amostra). Mas ja esta na hora de enfrentar os pro- 
blemas nas amostras, pois, na maioria das situapoes praticas, o que temos e uma amostra de valores 
de Y correspondentes a alguns X fixados. Nossa tarefa agora e estimar a funpao de regressao com base 
em informapoes amostrais. 

Para ilustrar, imagine que a populapao da Tabela 2.1 seja desconhecida e que a unica infor- 
mapao que tenhamos seja uma amostra selecionada aleatoriamente de valores de Y para os X 
fixados, como na Tabela 2.4. Ao contrario da Tabela 2.1, so temos um valor de Y para cada X\ 
cada Y (dado X,) na Tabela 2.4 foi escolhido aleatoriamente dentre os Y correspondentes aos A, dados 
para a populapao mostrada na Tabela 2.1. 

Apergunta e: com base na amostra da Tabela 2.4, e possivel prever as despesas medias de consu¬ 
mo semanais Y para a populapao como um todo correspondentes aos A escolhidos? Em outras pala- 
vras, podemos estimar a FRP com base nos dados da amostra? Como o leitor seguramente desconfia, 


11 FRIEDMAN, Milton. A theory of the consumption function. Princeton, N. J.: Princeton University Press, 1957. 

12 "As descripoes devem ser mantidas o mais simples possivel, ate que se prove sua inadequapao. NEWMAN, 
J. R. (Coord.). The world of mathematics. Nova York: Simon & Schuster, 1956. v. 2, p. 1.247. Ou "As entidades 
nao deveriam ser multiplicadas alem do necessario". In: MORRISON, Donald F. Applied linear statistical meth¬ 
ods. Englewood Cliffs, N. J.: Prentice Hall, 1983. p. 58. 
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nao seremos capazes de estimar “precisamente” a FRP devido a variagoes amostrais. Para melhor 
entender, suponha que selecionemos outra amostra aleatoria da populagao da Tabela 2.1, como a que 
aparece na Tabela 2.5. 

Representando graficamente os dados das Tabelas 2.4 e 2.5, obtemos o diagrama de dispersao 
apresentado na Figura 2.4. No diagrama, tragamos duas linhas de regressao amostral para “ajustar” 
os pontos razoavelmente: FRA! baseia-se na primeira amostra e FRA 2 , na segunda. Qual das duas 
linhas de regressao representa a linha de regressao populacional “real”? Se evitarmos a tentagao de 
olhar a Figura 2.1 que, por definigao, representa a regressao populacional, nao ha como ter certeza 
absoluta de qual das linhas de regressao da Figura 2.4 representa a verdadeira linha (ou curva) de 
regressao populacional. As linhas de regressao da Figura 2.4 sao conhecidas como linhas de regressao 
amostral. Supostamente, representam a linha de regressao populacional, mas devido as variagoes amos¬ 
trais, elas sao, no maximo, aproximagoes da verdadeira regressao populacional. Em geral, obtemos N 
diferentes FRAs para N amostras diferentes, e estas FRAs provavelmente nao serao as mesmas. 

Agora, tal como no caso da FRP subjacente a linha de regressao populacional, podemos formular 
o conceito de fungao de regressao amostral (FRA) para representar a linha de regressao da amostra. A 
equagao correspondente a (2.2.2) para a amostra pode ser escrita como 

Yi^fr+faXi ( 2 . 6 . 1 ) 


em que Y le-se “7 chapeu” 

?i = estimador de E( Y I X t ) 

Pi = estimador de Pi 
P 2 = estimador de p 2 

Observe que um estimador, tambem conhecido como estatistica (amostral), e apenas uma regra ou 
formula ou metodo que nos diz como estimar o parametro da populagao com base nas informagoes 
oferecidas pela amostra que temos a mao. Um valor numerico em particular obtido pela aplicagao do 
estimador e conhecido como estimativa. 13 Pode ser visto como aleatorio, mas uma estimativa nao e 
aleatoria. (Por que?) 

Agora, assim como expressamos a FRP de duas formas equivalentes, Equagao (2.2.2) e Equagao 
(2.2.4), podemos expressar a FRA na Equagao 2.6.1 em sua forma estocastica como a seguir: 

Yi = Pi + PiXi + Ui ( 2 . 6 . 2 ) 


TABELA 2.4 

Amostra aleatoria da populagao 
da Tabela 2.1 


TABELA 2.5 

Outra amostra aleatoria da populagao 
da Tabela 2.1 


Y 

X 

Y 

X 

70 

80 

55 

80 

65 

100 

88 

100 

90 

120 

90 

120 

95 

140 

80 

140 

110 

160 

118 

160 

115 

180 

120 

180 

120 

200 

145 

200 

140 

220 

135 

220 

155 

240 

145 

240 

150 

260 

175 

260 


13 


Como mencionado na Introdugao, o chapeu sobre a variavel representa um estimador do valor populacional 
relevante. 
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FIGURA 2.4 

Linhas de 
regressao 
baseadas em duas 
amostras 
diferentes. 



Renda semanal (em $) 


em que, alem dos simbolos ja definidos, u, denota o termo residual (na amostra). Conceitualmente, u„ 
e analogo a m, e pode ser considerado uma estiumtiva de Foi incluido na FRA pelas mesmas razoes 
que Uj foi incluido na FRP. 

Resumindo, entao, verificamos que nosso objetivo primordial na analise de regressao e estimar a 
FRP 


Yj — Pi + P2X1 + Uj 


(2.4.2) 


com base na FRA 


Y, = (h + hi + ^ (2.6.2) 

porque frequentemente nossa analise baseia-se em uma unica amostra de alguma populac:ao. Mas, devido 
a varia 5 oes amostrais, nossas estimativas da FRP com base na FRA sao, na melhor das hipoteses, apenas 
uma aproximagao. Essa aproximagao e apresentada graficamente na Figura 2.5. 

Para X = X h temos uma observagao (amostral) Y= Y t . Em termos da FRA, o Y i observado pode ser 
expresso como: 

Yj = Yi + it,- (2.6. B) 


e em termos de FRP, como: 


Yj — E(Y | Xj) + Uj (2.6.4) 

Obviamente, na Figura 2.5, Y, superestima a verdadeira E(Y I X ,) para o A, nela mostrado. Da 
mesma forma, para cada Xj a esquerda do ponto A, a FRA subestimara a verdadeira FRP Contudo, 
o leitor pode ver facilmente que essas sobre e subestima 5 oes sao inevitaveis devido as varia§des 
amostrais. 

A pergunta critica agora e: sabendo que a FRA nao e mais do que uma aproxima 5 ao da FRP, podemos 
formular uma regra ou um metodo que torne essa aproxima^ao a mais proxima possivel? Em outras pa- 
lavras, como devemos formular a FRA para que , fique o mais proximo possivel do verdadeiro ( J >\ e ft 2 
do verdadeiro /3 2 , mesmo que nunca venhamos a saber quais sao os verdadeiros fti e 
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FIGURA 2.5 

Linhas de regressao 
para uma amostra e 
para a popula§ao. 


Y 



Renda semanal (em $) 


A resposta para essa pergunta ocupara grande parte de nossa atengao no Capftulo 3. Aqui desta- 
camos que e posslvel desenvolver procedimentos que nos digam como formular a FRA a fim de 
espelhar FRP o mais fielmente possivel. E fascinante considerar que isso pode ser feito mesmo que 
nunca determinemos a FRP real. 


2.7 Exemplos ilustrativos 


Concluiremos este capftulo com dois exemplos. 


EXEMPLO 2.1 

Saldrio-hora 
medio segundo 
o nivel de 
escolaridade 


A Tabela 2.6 apresenta dados relativos ao nfvel de escolaridade (medido pelo numero de 
anos de frequencia escolar), o salario-hora medio das pessoas em cada nfvel de escolaridade 
e o numero de pessoas em cada um desses nfveis. Ernst Berndt obteve originalmente os 
dados apresentados na tabela com base em um levantamento da popula^ao conduzido em 
maio de 1985. 14 


TABELA 2.6 

Anos de estudo 

Salario medio ($/hora) 

Numero de 

Salario medio 

6 

4,4567 

3 

segundo nfvel de 

7 

5,7700 

5 

escolaridade 

8 

5,9787 

15 

Fonte: Adaptado de 

9 

7,3317 

12 

GOLDBERGER, 

10 

7,3182 

17 

Arthur S. Introductory 

11 

6,5844 

27 

Cambridge, Mass.: 

12 

7,8182 

218 

Harvard University 

13 

7,8351 

37 

Press, 1998. p. 5. 

14 

11,0223 

56 


15 

10,6738 

13 

16 

10,8361 

70 

17 

13,6150 

24 

18 

13,5310 

31 



Total 528 


14 BERNDT, Ernst R. The practice of econometrics: classic and contemporary. Reading, Mass.: Addison Wesley, 1991. 
Convem mencionar que se trata de um livro excelente no qual o leitor podera ver como os econometris- 
tas conduzem suas pesquisas. 
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EXEMPLO 2.1 

( Continuagao) 


Representando graficamente o salario medio (condicional) em relagao a educagao, 
obtemos o diagrama da Figura 2.6. A curva de regressao mostra como os salarios medios 
variam com o nfvel de escolaridade; eles em geral aumentam com o nfvel de escolaridade, 
o que nao surpreende. Estudaremos, mais adiante, como outras variaveis, alem da escola¬ 
ridade, tambem afetam o salario medio. 


FIGURA 2.6 

Relagao entre 
salarios medios e 
nfvel de 
escolaridade. 



EXEMPLO 2.2 

Pontuagao em 
matematica no 
Teste de 
Aptidao 
Escolar 
segundo a 
renda familiar 


A Tabela 2.10 no Exercfcio 2.17 fornece dados sobre a pontuagao media no Teste de 
Aptidao Escolar (Scholastic Aptitude Test - SAT) em aptidao verbal, matematica e redagao 
para alunos que estao se preparando para ingressar no ensino superior com base em 
947.347 estudantes que realizaram o teste em 2007. Tragando graficamente a pontuagao 
media em matematica com base na renda media familiar, obtivemos a Figura 2.7. 

Nota: como a renda da primeira e ultima categorias mostrada na Tabela 2.10 tern natu- 
reza ilimitada, preconizou-se que a menor renda media familiar seria de $ 5 mil e a maior 
seria de $ 150 mil. 


FIGURA 2.7 

Relagao entre 
pontuagao media 
em matematica 
no SAT e renda 
media familiar. 



( Continua ) 
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EXEMPLO 2.2 

( Continuagdo) 


Como a Figura 2.7 mostra, a pontuagao media em matematica acompanha o aumento 
da renda familiar. Como o numero de estudantes que realizam o exame SAT e bastante 
grande, provavelmente representa toda a popula^ao de alunos que fizeram o teste. Portan- 
to, a linha de regressao trafada na Figura 2.7 provavelmente representa a linha de regressao 
populacional. 

Pode haver varias razoes para a relanao positiva observada entre as duas variaveis. Por 
exemplo, e possfvel argumentar que os estudantes de familias com maior nfvel de renda 
tenham mais condigoes de arcar com aulas particulares ou cursos preparatories para o teste. 
Alem disso, os pais dos estudantes de familias de renda mais alta provavelmente tern esco- 
laridade maior. Tambem e possfvel que alunos com maior pontua^ao em matematica ve- 
nham de escolas melhores. O leitor pode fornecer outras explicates para a relafao positiva 
observada entre as duas variaveis. 


Resumo e 
conclusoes 


1 . O conceito-chave subjacente a analise de regressao e o de fun can de esperan^a condicional (EEC) 
ou funcao de regressao populacional (FRP). Nosso objetivo na analise de regressao e verificar como 
o valor medio da variavel dependente (ou regressando) varia com o valor da variavel explanatoria 
(regressor). 

2. Este livro trata principalmente de FRPs lineares, isto e, regressoes que sao lineares nos parametros. 
Elas podem ou nao ser lineares no regressando ou nos regressores. 

3. Para fins empiricos, o que importa e a FRP estocastica O termo de erro estocastico, it, desem- 
penha um papel fundamental na estimagao da FRP. 

4. A FRP e um conceito idealizado, ja que na pratica muito raramente temos acesso a toda a 
populagao que nos interessa. Em geral, temos uma amostra de observances da popula^'fio. 
Portanto, utilizamos a,v fun^oes estocasticas de regressao amostral (FRA) para estimar a FRP. 
No Capftulo 3, veremos como fazer isso. 


EXERCICIOS 2 . 1 . 

2 . 2 . 

2.3. 


2.5. 

2 . 6 . 


Modelo 

Titulo descritivo 

a. Yj = Pi + P2 ^ + u. 

Reciproco 

b. Yj = Pi + 02 In Xj + Uj 

c. In Yj =0i+ 02 Xj + Uj 

d. In Yj = In 0i + 0 2 In X,- + U/ 

e. In Yj =0^-02 + Uj 

Semilogaritmico 

Semilogarftmico inverso 

Logaritmico ou duplo logaritmo 

Logaritmico reciproco 


O que e funcao de esperanna condicional ou funcao de regressao populacional? 

Qual a diferenna entre as funfoes de regressao populacional e amostral? Essa distin?ao e 
indiferente? 

Qual o papel do termo de erro estocastico, u h na analise de regressao? Qual a diferen?a entre 
o termo de erro estocastico e o resfduo, u‘? 

Por que precisamos da analise de regressao? Por que nao usar simplesmente o valor medio do 
regressando como o melhor valor? 

O que entendemos por modelo de regressao linear ? 

Determine se os modelos a seguir sao lineares nos parametros ou nas variaveis ou em ambos. 
Quais destes modelos sao modelos de regressao linear? 


Nota: In = logaritmo natural (isto e, logaritmo de base e)\ m, e o termo de erro estocastico. Estudaremos esses modelos no Capftulo 6. 
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Parte Um 


Modelos de regressao com equaqao unica 


2.7. Os modelos a seguir sao modelos de regressao linear? Justifique sua resposta. 

a. Yj = e ^' +PlXi+Ui 

1 

h v = _ 

1 j -f- +ui 

c. In Y, = Pi + f $2 ^ + u ‘ 

d. Yi = Pi + (0,75 - + ut 

e. Yi = Pi + fi\Xi + Uj 


2.8. O que entendemos por modelo de regressao intrinsecamente linear ? Se fi 2 no Exercfcio 2.7d fosse 
0,8, seria um modelo de regressao linear ou nao-linear? 

2.9. Considere os modelos nao-estocasticos a seguir (isto e, modelos sem termo de erro estocastico). Sao 
modelos de regressao linear? Se nao forem, e possivel, por meio de manipulacjoes algebricas adequa- 
das, converte-los em modelos lineares? 

1 

+ Pi X, 

Xj 

Pi + PiXi 

1 

1 + exp (~Pi - p 2 X,) 


a. Yi = 

b. Yi = 

c. Yi = 


2.10. Dados o grafico de dispersao da Figura 2.8 e linha de regressao correspondente, que conclusao 
geral voce tiraria do diagrama? A linha de regressao da figura e populacional ou amostral? 

2.11. Com base no diagrama de dispersao da Figura 2.9, que conclusoes gerais poderiam ser tiradas? 
Qual a teoria economica que embasa o grafico? ( Dica : pesquise em um livro de economia inter- 
nacional o modelo de comercio de Fleckscher-Ohlin). 

2.12. O que o grafico de dispersao da Figura 2.10 revela? Voce afirmaria que a legisla^ao relativa ao 
salario minimo contribui para o bem-estar economico? 


FIGURA 2.8 

Taxas de crescimento 
das exportajoes e dos 
salarios no setor 
industrial. Dados 
para 50 paises em 
desen volvimento, 
1970-1990. 

Fonte: World Bank, World 
Development Report 1995, 
p. 55. A fonte original reune 
dados da UNIDO e do 
Banco Mundial. 



♦ Leste da Asia e Pacffico 

♦ Sul da Asia 

♦ America Latina e Caribe 

♦ Africa Subsaariana 

♦ Oriente Medio e norte da Africa 
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FIGURA 2.9 

Intensidade de 
qualificagao das 
exportagoes e dotagao 
de capital humano. Os 
dados se referem a 126 
pafses industrializados 
e em desenvolvimento 
em 1985. Os valores 
no eixo horizontal sao 
os logaritmos da razao 
entre a escolaridade 
media do pais e sua 
area; no eixo vertical, 
estao os logaritmos da 
razao entre 
exportagoes de 
materias-primas e 
produtos 
manufaturados. 

Fonte: World Bank, World 
Development Report 1995, 
p. 59. Fontes primarias: 
para as exportagoes, banco 
de dados COMTRADE das 
Nagoes Uni das; para a 
escolaridade, dados da 
UNDP, 1990; e para a terra, 
dados do Banco Mundial. 



C/3 


s 



Abundancia de terra; Escassez de terra; 

trabalhadores menos qualificados trabalhadores mais qualificados 

Medias regionais: ♦ America Latina e Caribe 

♦ Leste da Asia e Pacffico ♦ Sul da Asia 

♦ Economais de mercado industrializadas ♦ Africa Subsaariana 


2.13 A linha de regressao apresentada na Figura 1.3 da Introdugao e uma FRP ou uma FRA? Por 
que? Como voce interpretaria os pontos situados em torno da linha de regressao? Alem do PIB, 
que outros fatores, ou variaveis, poderiam determinar as despesas pessoais de consumo? 


FIGURA 2.10 

Salario mi'nimo e 
PNB per capita. A 
amostra e formada 
por 17 pafses em 
desenvolvimento. Os 
anos variant por pafs 
no perfodo de 1988 a 
1992. Os dados estao 
em pregos 
intemacionais. 

Fonte: World Bank, World 
Development Report 1995, 
p. 75. 


Razao entre o total do salario rmnimo 
recebido durante 12 meses e o PNB per capita 



Exerdcios aplicados 

2.14 Com os dados da Tabela 2.7 relativos aos Estados Unidos nos perfodo 1980-2006: 

a. Represente graficamente a relagao entre a taxa de participagao dos homens na forga de 
trabalho civil e a taxa de desemprego civil dos homens. Trace, a olho, uma linha de regres¬ 
sao que passe pelos pontos. A priori , qual a relagao esperada entre as duas variaveis e em 
que teoria economica esta embasada? O diagrama de dispersao respalda essa teoria? 
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TABELA 2.7 

Anos 

TPFTCH 1 

TPFTCM 2 

TDCH 3 

TDCM 4 

GMH82 5 

GMH 6 

Dados da participate) 
na forja de trabalho 
nos Estados Unidos 

1980 

77,40000 

51,50000 

6,900000 

7,400000 

7,990000 

6,840000 

1981 

77,00000 

52,10000 

7,400000 

7,900000 

7,880000 

7,430000 

1980-2006 

1982 

76,60000 

52,60000 

9,900000 

9,400000 

7,860000 

7,860000 

1983 

76,40000 

52,90000 

9,900000 

9,200000 

7,950000 

8,190000 


1984 

76,40000 

53,60000 

7,400000 

7,600000 

7,950000 

8,480000 


1985 

76,30000 

54,50000 

7,000000 

7,400000 

7,910000 

8,730000 


1986 

76,30000 

55,30000 

6,900000 

7,100000 

7,960000 

8,920000 


1987 

76,20000 

56,00000 

6,200000 

6,200000 

7,860000 

9,130000 


1988 

76,20000 

56,60000 

5,500000 

5,600000 

7,810000 

9,430000 


1989 

76,40000 

57,40000 

5,200000 

5,400000 

7,750000 

9,800000 


1990 

76,40000 

57,50000 

5,700000 

5,500000 

7,660000 

10,190000 


1991 

75,80000 

57,40000 

7,200000 

6,400000 

7,580000 

10,500000 


1992 

75,80000 

57,80000 

7,900000 

7,000000 

7,550000 

10,760000 


1993 

75,40000 

57,90000 

7,200000 

6,600000 

7,520000 

11,030000 


1994 

75,10000 

58,80000 

6,200000 

6,000000 

7,530000 

11,320000 


1995 

75,00000 

58,90000 

5,600000 

5,600000 

7,530000 

11,640000 


1996 

74,90000 

59,30000 

5,400000 

5,400000 

7,570000 

12,030000 


1997 

75,00000 

59,80000 

4,900000 

5,000000 

7,680000 

12,490000 


1998 

74,90000 

59,80000 

4,400000 

4,600000 

7,890000 

1 3,000000 


1999 

74,70000 

60,00000 

4,100000 

4,300000 

8,000000 

1 3,470000 


2000 

74,80000 

59,90000 

3,900000 

4,100000 

8,030000 

14,000000 


2001 

74,40000 

59,80000 

4,800000 

4,700000 

8,110000 

14,530000 


2002 

74,10000 

59,60000 

5,900000 

5,600000 

8,240000 

14,950000 


2003 

73,50000 

59,50000 

6,300000 

5,700000 

8,270000 

15,350000 


2004 

73,30000 

59,20000 

5,600000 

5,400000 

8,230000 

15,670000 


2005 

73,30000 

59,30000 

5,100000 

5,100000 

8,170000 

16,110000 


2006 

73,50000 

59,40000 

4,600000 

4,600000 

8,230000 

16,730000 


Fonte: Economic Report of the President, 2007. 

As citagoes abaixo se referem ao documento original. 

TPFTCH. Taxa de participagao na force de trabalho civil, homens (%), Tabela B-39, p.277. 
2 TPFTCM, Taxa de participapao na forca de trabalho civil, mulheres (%), Tabela B-39, p.277. 
3 TDCH, Taxa de desemprego civil, homens (%), Tabela B-42, p.280. 

4 TDCM, Taxa de desemprego civil, mulheres (%), Tabela B-42, p.280. 

5 GMH82, ganho medio por hora (em dolares de 1982), Tabela B-47, p.286. 

6 GMH, ganho medio por hora (em dolares correntes), Tabela B-47, p.286. 


b. Faya o mesmo para as mulheres. 

c. Agora, represente graficamente a taxa de participate de homens e mulheres em relato 
aos ganhos medios por hora (em dolares de 1982). (Voce pode usar graficos separados.) O 
que constatou? Como voce justificaria isso? 

d. E possivel representar graficamente a taxa de participafao na for 9 a de trabalho em rela- 
9 ao a taxa de desemprego e aos ganhos medios por horas simultaneamente? Em caso 
negativo, como voce expressaria a relatjao entre as tres variaveis? 

2.15. A Tabela 2.8 apresenta dados sobre despesas com alimenta 9 ao e totais, em rupias, para uma 
amostra de 55 domieflios rurais da India. (No imcio de 2000, um dolar americano era equiva- 
lente a cerca de 40 rupias indianas.) 

a. Represente graficamente os dados colocando no eixo vertical as despesas com alimentafao 
e no eixo horizontal os gastos totais. Trace uma linha de regressao. 

b. Que conclusoes gerais voce pode tirar deste exemplo? 

c. Voce esperaria, a priori , que as despesas com alimenta 9 ao aumentassem linearmente com 
o aumento das despesas totais, independentemente do nivel destas? Por que? Utilize a 
despesa total como uma proxy para o nivel de renda total. 
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TABELA 2.8 Despesas totais e com alimenta^ao (em mpias) 



Despesas com 

Despesa 


Despesas com 

Despesa 

Observa^ao 

alimentafao 

total 

Observajao 

alimenta^ao 

total 

1 

217,0000 

382,0000 

29 

390,0000 

655,0000 

2 

196,0000 

388,0000 

30 

385,0000 

662,0000 

3 

303,0000 

391,0000 

31 

470,0000 

663,0000 

4 

270,0000 

415,0000 

32 

322,0000 

677,0000 

5 

325,0000 

456,0000 

33 

540,0000 

680,0000 

6 

260,0000 

460,0000 

34 

433,0000 

690,0000 

7 

300,0000 

472,0000 

35 

295,0000 

695,0000 

8 

325,0000 

478,0000 

36 

340,0000 

695,0000 

9 

336,0000 

494,0000 

37 

500,0000 

695,0000 

10 

345,0000 

516,0000 

38 

450,0000 

720,0000 

11 

325,0000 

525,0000 

39 

415,0000 

721,0000 

12 

362,0000 

554,0000 

40 

540,0000 

730,0000 

13 

315,0000 

575,0000 

41 

360,0000 

731,0000 

14 

355,0000 

579,0000 

42 

450,0000 

733,0000 

15 

325,0000 

585,0000 

43 

395,0000 

745,0000 

16 

370,0000 

586,0000 

44 

430,0000 

751,0000 

17 

390,0000 

590,0000 

45 

332,0000 

752,0000 

18 

420,0000 

608,0000 

46 

397,0000 

752,0000 

19 

410,0000 

610,0000 

47 

446,0000 

769,0000 

20 

383,0000 

616,0000 

48 

480,0000 

773,0000 

21 

315,0000 

618,0000 

49 

352,0000 

773,0000 

22 

267,0000 

623,0000 

50 

410,0000 

775,0000 

23 

420,0000 

627,0000 

51 

380,0000 

785,0000 

24 

300,0000 

630,0000 

52 

610,0000 

788,0000 

25 

410,0000 

635,0000 

53 

530,0000 

790,0000 

26 

220,0000 

640,0000 

54 

360,0000 

795,0000 

27 

403,0000 

648,0000 

55 

305,0000 

801,0000 

28 

350,0000 

650,0000 





Fonte: MUKHERJEE, Chandan; WHITE, Howard; WUYTS, Marc. Econometrics and data analysis for developing countries. Nova York: Routledge, 1998. p. 457. 


2.16. A Tabela 2.9 apresenta dados sobre a pontua§ao media do Teste de Aptidao Escolar (SAT) para 
os estudantes que se preparavam para ingressar no ensino superior no perfodo 1967-1990. 

a. Use o eixo horizontal para os anos e o eixo vertical para a pontua£ao obtida para tra£ar 
as notas nas provas de aptidao verbal e matematica obtidas por homens e mulheres, 
separadamente. 

b. Que conclusoes gerais voce tirou desses graficos? 

c. Conhecendo a pontua£ao de homens e mulheres nos testes de aptidao verbal, voce pode- 
ria prever suas notas em matematica? 

d. Represente graficamente as notas de matematica das mulheres em relac^ao as dos homens. O 
que voce observa? 

2.17. A Tabela 2.10 apresenta dados sobre a pontua§ao media no SAT em relagao a renda para tres 
tipos de provas: aptidao verbal, matematica e reda£ao. No Exemplo 2.2, apresentamos a Figu- 
ra 2.7, que representa graficamente a pontua?ao media em matematica em rela?ao a renda 
media familiar. 

a. Consulte a Figura 2.7 e prepare um grafico semelhante relacionando as notas de aptidao 
verbal a renda media familiar. Compare seus resultados com aqueles da Figura 2.7. 

b. Repita o exercfcio (a) relacionando as notas de reda£ao a renda media familiar. 

c. Examinando os tres graficos, que conclusoes gerais voce pode tirar? 
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TABELA 2.9 

Pontuagao obtida nos 
testes de aptidao 



Aptidao verbal 



Matematica 


Ano 

Homens 

Mulheres 

Total 

Homens 

Mulheres 

Total 

escolar dos estudantes 

1972 

531 

529 

530 

527 

489 

509 

que se preparavam 

1973 

523 

521 

523 

525 

489 

506 

para ingressar no 

1974 

524 

520 

521 

524 

488 

505 

ensino superior, 

1975 

515 

509 

512 

518 

479 

498 

1972-2007 

1976 

511 

508 

509 

520 

475 

497 

Fonte: College Board, 2007. 

1977 

509 

505 

507 

520 

474 

496 

1978 

511 

503 

507 

517 

474 

494 


1979 

509 

501 

505 

516 

473 

493 


1980 

506 

498 

502 

515 

473 

492 


1981 

508 

496 

502 

516 

473 

492 


1982 

509 

499 

504 

516 

473 

493 


1983 

508 

498 

503 

516 

474 

494 


1984 

511 

498 

504 

518 

478 

497 


1985 

514 

503 

509 

522 

480 

500 


1986 

515 

504 

509 

523 

479 

500 


1987 

512 

502 

507 

523 

481 

501 


1988 

512 

499 

505 

521 

483 

501 


1989 

510 

498 

504 

523 

482 

502 


1990 

505 

496 

500 

521 

483 

501 


1991 

503 

495 

499 

520 

482 

500 


1992 

504 

496 

500 

521 

484 

501 


1993 

504 

497 

500 

524 

484 

503 


1994 

501 

497 

499 

523 

487 

504 


1995 

505 

502 

504 

525 

490 

506 


1996 

507 

503 

505 

527 

492 

508 


1997 

507 

503 

505 

530 

494 

511 


1998 

509 

502 

505 

531 

496 

512 


1999 

509 

502 

505 

531 

495 

511 


2000 

507 

504 

505 

533 

498 

514 


2001 

509 

502 

506 

533 

498 

514 


2002 

507 

502 

504 

534 

500 

516 


2003 

512 

503 

507 

537 

503 

519 


2004 

512 

504 

508 

537 

501 

518 


2005 

513 

505 

508 

538 

504 

520 


2006 

505 

502 

503 

536 

502 

518 


2007 

504 

502 

502 

533 

499 

515 


Nota: para o perfodo 1972-1986 aplicou-se uma formula a media original e ao desvio padrao para converter a media para a esca- 
la normatizada (recentered scale). Para o perfodo 1987-1995, as notas individuals dos alunos foram convertidas para a escala 
normatizada e, em seguida, a media foi recalculada. No perfodo de 1996-1999, praticamente todos os alunos receberam notas na 
escala normatizada. Todas as notas que ainda estavam na escala original foram convertidas para a escala normatizada antes do 
calculo da media. No perfodo 2000-2007, todas as notas foram publicadas na escala normatizada. 
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TABELA 2.10 

Pontua§ao obtida nos 


Aptidao verbal Matematica 


Reda^ao 


testes de aptidao 
escolar classificada 
por renda familiar 

Renda 
Familiar ($) 

Numero de 
alunos que 
realizam o teste 

Media 

DP 

Media 

DP 

Media 

DP 

Fonte: College Board, 2007. 

<10.000 

40610 

427 

107 

451 

122 

423 

104 

Alunos ingressando no 

10000-20000 

72745 

453 

106 

472 

113 

446 

102 

ensino superior, 

Tabela 11. 

20000-30000 

61244 

454 

102 

465 

107 

444 

97 

30000-40000 

83685 

476 

103 

485 

106 

466 

98 


40000-50000 

75836 

489 

103 

486 

105 

477 

99 

50000-60000 

80060 

497 

102 

504 

104 

486 

98 

60000-70000 

75763 

504 

102 

511 

103 

493 

98 

70000-80000 

81627 

508 

101 

516 

103 

498 

98 

80000-100000 

130752 

520 

102 

529 

104 

510 

100 

>100000 

245025 

544 

105 

556 

107 

537 

103 







Capitulo 

Modelo de regressao 
de duas variaveis: o 
problema da estimagao 

Como visto no Capitulo 2, nossa primeira tarefa e estimar a fungao de regressao populacional 
(FRP) com base na fungao de regressao amostral (FRA) da maneira mais precisa possrvel. No 
Apendice A, examinaremos dois metodos de estimagao muito usados: (1) o dos mmimos quadrados 
ordinarios (MQO); e (2) o de maxima verossimilhanga (MV). Em grande parte, o primeiro metodo e 
o mais utilizado para a analise de regressao principalmente porque e intuitivamente convin- 
cente e matematicamente muito mais simples que o da maxima verossimilhanga. Alem disso, como 
mostraremos mais adiante, no contexto da regressao linear, os dois costumam proporcionar 
resultados similares. 



3.1 Metodo dos mniimos quadrados ordinarios 

Este metodo e atribuido a Carl Friedrich Gauss, um matematico alemao. Sob certas hipoteses (que 
serao discutidas na Segao 3.2), o MQO tem algumas propriedades estatisticas muito atraentes que o tor- 
naram um dos metodos de analise de regressao mais poderosos e difundidos. Para que voce o entenda, 
explicaremos primeiro o principio dos mmimos quadrados. 

Recordando a FRP de duas variaveis: 

Yi — Pi + PiX-i + M; (2.4.2) 

No entanto, como vimos no Capitulo 2, a FRP nao pode ser observada diretamente. Temos de estima- 
-la por meio da FRA: 


Yi — + fiiXj + U-, ( 2 . 6 . 2 ) 

= % + ^ (2.6.B) 

em que Y\ e o valor estimado (media condicional) de Y r 

Mas como determinamos a FRA propriamente dita? Primeiro, expressamos (2.6.3) como 

u i =Y i -Y i (3.1.1) 

= Y t -ft i -faXi 


78 


que mostra que «,■ (os resfduos) sao simplesmente as diferengas entre os valores observados e estima- 
dos de Y. 
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FIGURA 3.1 

Criterio dos mfnimos 
quadrados. 



Agora, dados n pares de observa£6es de Y e X, queremos determinar a FRA de maneira que fique 
o mais proximo possfvel do Y observado. Para tanto, podemos adotar o seguinte criterio: escolher a 
FRA de tal forma que a soma dos resfduos ^ (Y t — Y ; ) seja a menor possfvel. Embora con- 

vincente, esse nao e um criterio muito bom, como se pode ver pelo diagrama de dispersao hipotetico 
apresentado na Figura 3.1. 

Se adotarmos o criterio de minimizar o a Figura 3.1 mostra que os resfduos u 2 e u 2 , bem como 
os resfduos iq e u 4 , tem o mesmo peso na soma (iq + u 2 + iq + iq), embora os dois primeiros estejam 
muito mais proximos da FRA que os dois ultimos. Em outras palavras, todos os resfduos recebem a mes- 
ma importancia independentemente de quao proximos ou distantes estejam das observa£oes individual 
em rela£ao a FRA. Como consequencia, e bem possfvel que a soma algebrica dos i q seja pequena (ou ate 
zero) embora os iq estejam muito dispersos em rela 5 ao a FRA. Paramelhor entender, atribua a tq, u 2 , u :i 
e u 4 da Figura 3.1 os valores de 10, — 2, + 2 e —10, respectivamente. A soma algebrica desses resfduos e 
zero, embora M[ e u 4 estejam bem mais afastados da FRA do que u 2 e u 4 . Podemos evitar o problema 
adotando o criterio dos minimos quadrados, segundo o qual a FRA pode ser fixada de tal maneira que 




(3.1.2) 


seja o menor possfvel, onde os uf sao os resfduos elevados ao quadrado. Ao eleva-los ao quadrado, este 
metodo da mais peso aos resfduos como tq e u 4 da Figura 3.1, do que aos resfduos u 2 e u 4 . Como ja foi 
mencionado, sob o criterio do mfnimo JAq, o somatorio pode ser pequeno embora os ti, estejam muito 
dispersos em relayao a FRA. Mas isso nao e possfvel sob o criterio dos mfnimos quadrados, porque 
quanto maior (em valores absolutos), maior yjt'q 2 . Outra justificativa para o uso do metodo de 
mfnimos quadrados e que os estimadores obtidos tem algumas propriedades estatfsticas muito dese- 
javeis, como veremos em breve. 

Com base na Equa§ao (3.1.2), torna-se obvio que: 

J]k? = /GM 2 ) (3.1.3) 


isto e, a soma do quadrado dos resfduos e uma fungao dos estimadores e /C. Para qualquer con- 
junto de dados, a escolha de valores diferentes para ( J >\ e f J > 2 resultara em u diferentes e, portanto, em 
valores diferentes de Considere os valores hipoteticos de Ye X apresentados nas duas primeiras 
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TABELA 3.1 

Determina§ao 
experimental da FRA 


Y, 


Yu 

«i; 

u\i 

y 2! 

On 

«2i 

(1) 

(2) 

(3) 

(4) 

(5) 

(6) 

(7) 

(8) 

4 

1 

2,929 

1,071 

1,147 

4 

0 

0 

5 

4 

7,000 

-2,000 

4,000 

7 

2 

4 

7 

5 

8,357 

-1,357 

1,841 

8 

1 

1 

12 

6 

9,714 

2,286 

5,226 

9 

3 

9 

Soma: 28 

16 


0,0 

12,214 


0 

14 


Notas: ft, = 1,572 + 1,357ft (isto 6, ft = 1,572 e ft = 1,357) 
ft, = 3.0 + 1,0ft (isto e, ft = 3 e ft = 1,0) 

«i, = (17 -ft,) 

«2i = (ft -Yu) 


colunas da Tabela 3.1. Fagamos dois experimentos. No primeiro, considere = 1,572 e /J 2 = 1,357.' 
Usando esses valores de p e os valores de X fornecidos da coluna (2) da Tabela 3.1, podemos calcular 
facilmente os Y ■ estimados dados na coluna (3) como Y u (em que o subscrito 1 indica o primeiro ex- 
perimento). Agora, vamos conduzir outro experimento, desta vez utilizando os valores /l, = 3 e /j 2 = 1. 
Os valores estimados de Y t neste experimento aparecem como Y 2l na coluna (6) da Tabela 3.1. Como 
os valores de p nos dois experimentos sao diferentes, obtemos valores diferentes para os resfduos es¬ 
timados, como se ve na tabela; os u ,, sao os resfduos do primeiro experimento e os u 2i resfduos do 
segundo. Os quadrados desses residuos estao nas colunas (5) e (8). Obviamente, como poderiamos 
esperar da Equagao (3.1.3), a soma dos quadrados desses resfduos sao diferentes, ja que tem como 
base conjuntos diferentes de valores de p. 

Que conjunto de valores de p devemos escolher? Como os valores de ft do primeiro experimento 
nos fornecem um ^u? menor (= 12,214) do que os obtidos com os valores de p no segundo experi¬ 
mento (= 14), podemos dizer que os p do primeiro experimento sao os “melhores” valores. Mas como 
sabemos disso? Se tivessemos tempo e paciencia infinitos, poderiamos conduzir muitos mais experi¬ 
mentos desse tipo, escolhendo diferentes conjuntos de p a cada vez, comparando os Jjii, 2 resultantes 
e escolhendo o conjunto de valores de p que nos dessem o menor valor possfvel de Jjt), 2 , supondo, e 
claro, que tivessemos considerado todos os valores possfveis de /J, e ft 2 . Mas como tempo e, certa- 
mente, paciencia sao, em geral, escassos, precisamos encontrar algum atalho para esse processo de 
tentativa e erro. Felizmente, o metodo dos minimos quadrados oferece tal atalho. O principio, ou me- 
todo, dos mfnimos quadrados escolhe /l, e fi 2 de tal forma que, para qualquer amostra ou conjunto de 
dados, o e o menor possfvel. Em outras palavras, para uma dada amostra, o metodo dos mfnimos 
quadrados nos oferece estimativas unicas de [ J >\ e fi 2 que proporcionam o menor valor possfvel de 
"Yji}. Como isso e feito? E um exercicio direto de calculo diferencial. Como mostra o Apendice 
3A, em sua Se 5 ao 3A.1, o processo de diferenciagao resulta nas seguintes equa 5 oes para estimar 

Pi e Pi- 


E } 

'i — n P\ +PlJ2 X i 

(3.14) 

Y,X, 

= PiJ2 x ‘+P^xf 

(3.15) 


em que n e o tamanho da amostra. Essas equagoes simultaneas sao conhecidas como equacoes nor¬ 
mals. 

Resolvendo simultaneamente as equagoes normais, obtemos 


1 Estes valores foram obtidos aplicando-se o metodo dos mfnimos quadrados que veremos em breve. Veja 
as Equagoes (3.1.6) e (3.1.7). 
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% = n'EXjYi-'EXi'E'Yi 
n T, X f ~ (J2 X i) 2 

= BI, - X)(Yj - Y) 1 6) 

E(E -x ) 2 

_ E-^y/ 

' E *, 2 

em que X e Y sao as medias amostrais de X e de Y e onde definimos x t — (X, — X) e y ( = (Yj — Y). 
Daqui em dicmte, usaremos letras minusculas para indicar os desvios em relagao aos valores me- 
dios. 



(3.1.7) 


O ultimo passo da Equapao (3.1.7) pode ser obtido diretamente na Equa£ao (3.1.4) com manipulates 
algebricas simples. 

Vale notar que, fazendo uso de identidades algebricas simples, a Formula (3.1.6) para estimar de 
fi 2 tambem pode ser expressa como: 


h 


T, x iy< 

E*r 

Y. X i Y i 

EX 2 -"* 2 

E X 2 - nX 2 


(3.1.8) 2 


Os estimadores obtidos anteriormente sao conhecidos como estimadores de mmimos quadra- 
dos, pois sao derivados do principio dos mrnimos quadrados. Note as seguintes propriedades nume- 
ricas dos estimadores obtidos por meio do metodo dos MQO: “Propriedades numericas sao aquelas 
que se sustentam em consequencia do uso dos minimos quadrados ordinarios, independentemente 
das formas pelas quais os dados foram gerados”. 3 Em breve, veremos as propriedades estatisticas 
dos estimadores de MQO, isto e, as propriedades que “se mantem apenas sob certas hipoteses sobre 
a forma como os dados foram gerados”. 4 (Veja o modelo classico de regressao linear na Secjao 3.2.) 


I. Os estimadores de MQO sao expressos unicamente em termos de quantidades observaveis 
(amostrais), como X e Y. Portanto, podem ser calculados com facilidade. 


2 Nota 1:J2 X ? = E( x < - X) 2 = E - 2 EMX + E* 2 = E*? - 2 *E + £X 2 , pois Xe uma constante. 

Notando tambem que ^ X; = nX e £ X 2 = ^x 2 , pois X e uma constante, obtemos por fim 

£*, 2 =£* 2 -nX 2 . 

Nota 2: £ X; y/ = £ ^(V/ — Y) = £ x-, Yj — Y £ x; = £ x,- Yj — Y £(X/ — X) = £ x, Y, t pois ? e uma constante e 
ja que a soma dos desvios de uma variavel em relacao ao seu valor medio (por exemplo, £(X, — X)) e sempre zero. 
Da mesma forma, £ y,- = £ (Yj— Y) = 0. 

3 DAVIDSON, Russell; MACKINNON, James G. Estimation and inference in econometrics. Nova York: Oxford Univer¬ 
sity Press, 1993. p. 3. 

4 Ibid. 
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Modelos de regressao com equagao linica 


II. Sao estimadores pontuais, isto e, dada a amostra, cada estimador proporciona apenas um 
unico valor (ponto) do parametro populacional relevante. (No Capftulo 5, veremos os cha- 
mados estimadores de intervalo, que oferecem um leque de valores possfveis para os pa- 
rametros desconhecidos da populagao.) 

III. Uma vez obtidas as estimativas de MQO para os dados amostrais, a linha de regressao amos- 
tral (Figura 3.1) pode ser obtida facilmente. Alinha de regressao assim obtida tem as seguin- 
tes propriedades: 

1. Passa pelas medias amostrais de Y e X. Esse fato fica obvio na Equa£ao (3.1.7), porque 
ela pode ser escrita como Y — /J, + fi 2 X, apresentada graficamente na Figura 3.2. 

2. O valor medio estimado do Y — Y, e igual ao valor medio do V observado para: 

Yi — Pi +kXi 

= (Y -p 2 X)+P2Xi (3.1.9) 

= Y+P 2 {Xi-X) 

Somando-se os dois lados dessa ultima igualdade aos valores amostrais e dividindo pelo 
tamanho da amostra, n, obtemos: 

(3.1.10) 5 

em que recorremos ao fato de que J](X, — X) — 0. (Por que?) 

3. O valor medio dos residuos, u, e igual a zero. Segundo a Se 5 ao 3A.1 do Apendice 3 A, a 
primeira equa 5 ao e 

-2 J2( y i - - P 2 Xi) = 0 

Mas, como u t = Y t — fix — P 2 X h a equa 5 ao anterior reduz-se a —2 — 0, em que 

u = 0. 6 


FIGURA 3.2 

Grafico que mostra 
que a linha de 
regressao da amostra 
passa pelos valores 
medios amostrais 
de YeX. 


Y 



5 Note que este resultado so e valido quando o modelo de regressao apresenta o intercepto fr. Como mostra a 
Secao 6A.1 do Apendice 6A, este resultado pode nao se aplicar quando /3 1 esta ausente do modelo. 

6 Este resultado tambem requer que o intercepto esteja presente no modelo (veja Secao 6A.1 do Apen¬ 
dice 6A). 
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Como resultado da propriedade anterior, a regressao amostral 

Yi — Pi + PiX, +Uj (2.6.2) 

pode ser expressa de modo que Y e X sejam considerados desvios de seus valores me- 
dios. Para ver isso, some (2.6.2) dos dois lados da cquayao para obter 

Yi — n.p i + P2 Xj + u i 

= nf }i +p 2 T,X, ja que ^ u, — 0 

Dividindo a Equa^ao (3.Ell) por n, obtemos 

Y=p x +p 2 X (3.1.12) 

que e igual a Equagao (3.1.7). Subtraindo a Equa 9 ao (3.1.12) da Equagao (2.6.2), obte¬ 
mos: 


Yi - Y = p 2 (Xi -X) + Ui 


(3.1.12) 


ou 


y, = p 2 x, + Ui ( 3 . 1 . 13 ) 

em que y t e x„ segundo nossa conven 9 ao, sao os desvios em rela 9 ao aos respectivos valores 
(amostrais) medios. 

A Equa 9 ao (3.1.13) e conhecida como formato de desvio. Note que o termo de inter- 
cepto Pi nao aparece aqui. Mas ele sempre pode ser estimado pela Equa 9 ao (3.1.7), 
isto e, devido ao fato de que a linha de regressao passa pelas medias amostrais de Y e 
X. Uma vantagem do formato de desvio e que ele frequentemente simplifica o calculo 
das formulas. 

Note tambem que, no formato de desvio, a FRA pode ser escrita como: 

9i - Pi x i ( 3 . 1 . 14 ) 

enquanto nas unidades originais de medida era Y; — P\ + p 2 Xj, como vimos na Equa- 
9ao (2.6.1). 

4. Os residuos ti, nao estao correlacionados ao Y t previsto. Isso pode ser verificado do se- 
guinte modo: usando o formato de desvio, podemos escrever: 

= p 2 Y'XjUi 
= Pi YMY - Pl x i) 

= kY,** ~ %T, x f ( 3 . 1 - 15 ) 

= H I > 2 - % E * 2 

= 0 

em que consideramos o fato de que p 2 — Y x iYi/12 x f- 

5. Os residuos u, nao estao correlacionados ao A,; isto e, m , Xj — 0. Esse fato e consequencia 
da Equa 9 ao (2) no Apendice 3A, Se 9 ao 3A. 1. 
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3.2 O modelo classico de regressao linear: as hipoteses subjacentes 
ao metodo dos imnimos quadrados 

Se nosso objetivo for apenas o de estimar /i, e /J 2 , o metodo dos MQO examinado na segao ante¬ 
rior e suficiente. Entretanto, lembre-se, do Capitulo 2, de que, na analise de regressao, nosso objetivo 
nao e apenas o de obter /i, e /%, mas o de tecer inferencias relativas aos verdadeiros /-i, e fi 2 . Por exem- 
plo, podemos estar interessados em saber quao proximos /i | e /L estao de suas contrapartes na popula- 
gao ou quanto Y t se aproxima da verdadeira E(Y | A",). Para isso, precisamos nao apenas especificar a 
forma funcional do modelo, como na Equagao (2.4.2), mas fazer certas hipoteses a respeito da ma- 
neira como Y t e gerado. Veja a FRP: Y, — + fi 2 X , + u r Ela demonstra que Y, depende de X, e u 

Portanto, a menos que sejamos especificos quanto a maneira como X, e m, foram criados ou gerados, 
nao ha forma de fazer qualquer inferencia estatistica sobre Y n e tambem, como veremos, sobre /i, e fi 2 . 
Assim, as hipoteses feitas quanto a(s) variavel(is) X, e ao termo de erro sao fundamentals para a inter- 
pretagao das estimativas da regressao. 

O modelo classico de regressao linear, gaussiano ou padrao (MCRL), que e a pedra angular de 
boa parte da teoria econometrica, parte de sete hipoteses. * * * * * * 7 Discutiremos primeiro essas hipoteses no 
contexto do modelo de regressao de duas variaveis; e, no Capitulo 7, as estenderemos ao modelo de 
regressao multipla, isto e, ao modelo em que ha mais de um regressor. Como sera discutido no Capi- 
tulo 7, este modelo pode ser estendido para incluir mais variaveis explicativas. 


HIPOTESE 1 Modelo de regressao linear: o modelo de regressao e linear nos parametros, embora 
possa nao ser linear nas variaveis. Este e o modelo de regressao como mostrado na Equagao. 
(2.4.2): 

Y-, = P i + P 2 %i + u i (2-4.2) 

Como sera discutido no Capitulo 7, este modelo pode ser estendido para incluir mais variaveis 
explicativas. 


Ja examinamos o modelo (2.4.2) no Capitulo 2. Como os modelos de regressao linear nos parame- 
tros sao o ponto de partida do MCRL, manteremos esta hipotese na maior parte do livro. 8 Tenha em 
mente que o regressando Leo regressor X podem ser nao lineares, conforme visto no Capitulo 2. 


HIPOTESE 2 Valores de X fixos ou independentes do termo de erro: valores assumidos pelo regressor X 
podem ser fixos em amostras repetidas (caso do regressor fixo) ou seus valores podem mudar de 
acordo com a variavel dependente Y (no caso do regressor estocastico). No segundo caso, supoe-se 
que as variaveis X e o termo de erro sao independentes, isto e, cov (X ■„ u,) = 0. 


Isso pode ser explicado em termos do exemplo da Tabela 2. 1. Considere as varias populagoes Y 

correspondentes aos niveis de renda mostrados na tabela. Mantendo fixo o valor da renda X no nivel 

de $ 80, podemos selecionar aleatoriamente uma familia e observar suas despesas semanais de consu- 
mo Y, que sao de $ 60. Ainda considerando X igual a $ 80, selecionamos outra familia e observamos 
o valor Y de $ 75. Em cada uma dessas selegoes (isto e, amostra repetida), o valor de X esta fixo em 

$ 80. Podemos repetir o processo para todos os valores de X apresentados na Tabela 2.1. Na verdade, 

as amostras das Tabelas 2.4 e 2.5 foram selecionadas dessa maneira. 

Por que assumimos que os valores de X nao sao estocasticos? Considerando que, na maioria das 
ciencias sociais, os dados para ambas as variaveis X e Y em geral sao coletados aleatoriamente. 


7 E classico no sentido de que foi formulado primeiro por Gauss em 1821 e, desde entao, serve de norma ou pa¬ 
drao em relagao ao qual podem ser comparados os modelos que nao atendem as premissas gaussianas. 

8 No entanto, no Capitulo 14, apresentaremos um breve exame dos modelos de regressao nao linear nos parametros. 
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FIGURA 3.3 
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parece natural assumir o oposto - que a variavel X, assim como a Y, tambem e aleatoria ou estocas- 
tica. Mas inicialmente consideraremos a variavel X nao estocastica pelas seguintes razoes: 

Primeiro , isso e feito inicialmente para simplificar e para apresentar gradualmente ao leitor 
as complexidades da analise de regressao. Segundo, em situa£oes experimentais talvez nao seja 
for£ado assumir que os valores de X sao fixos. Por exemplo, um fazendeiro pode dividir sua 
terra em diversos lotes e aplicar uma quantidade de fertilizante diferente em cada lote para ve- 
rificar o efeito sobre a plantaqiao. Da mesma maneira, uma loja de departamentos pode decidir 
aplicar diferentes porcentuais de desconto a um produto para verificar o impacto nos consumi- 
dores. As vezes podemos querer fixar os valores de X para uma finalidade especifica. Suponha 
que queiramos descobrir o rendimento medio semanal dos trabalhadores (X) com diversos nf- 
veis de escolaridade (P), como no caso dos dados fornecidos na Tabela 2.6. Desse modo, a va¬ 
riavel X pode ser considerada fixa ou nao estocastica. Terceiro, como mostraremos no Capitulo 13, 
mesmo que as variaveis X sejam estocasticas, os resultados estatfsticos da regressao linear baseada 
no caso de regressores fixos tambem sao validos quando a variavel X e aleatoria, contanto que 
algumas condicoes sejam atendidas. Uma condigao e de que o regressor X e o termo de erro u ,■ se¬ 
jam independentes. Como observa James Davidson, “[...] este modelo [isto e, de regressores estocas- 
ticos] ‘imita’ o modelo de regressores fixos, e [...] muitas das propriedades estatisticas de minimos 
quadrados no modelo de regressor fixo continuam validas”. 9 

Por todas essas razoes, discutiremos primeiro o modelo MCRL (regressor fixo) em detalhes. No 
entanto, no Capitulo 13, examinaremos o caso dos regressores estocasticos e ressaltaremos as ocasioes 
em que e necessario considerar os modelos de regressor estocastico. Casualmente, note que, se a 
variavel X for estocastica, o modelo resultante sera chamado de modelo neoclassico de regressao 
linear (MNRL ), 10 em contraste com o MCRL, em que as variaveis X sao tratadas como fixas ou nao 
aleatorias. Para fins de discussao, chamaremos o primeiro modelo de modelo de regressao estocas¬ 
tico e o segundo de modelo de regressao fixo. 

Esta hipotese afirma que o valor medio de u„ condicionado a um dado X r e zero. Geometricamen- 
te, esta hipotese pode ser ilustrada como na Figura 3.3, que mostra alguns dos valores da variavel X 
e das popula 5 oes Y associadas a cada uma delas. Conforme mostrado, cada popula?ao Y correspon- 


9 DAVIDSON, James. Econometric theory. RU: Blackwell Publishers, 2000. p. 10. 

10 Um termo de GOLDBERGER, Arthur S. A course in econometrics. Cambridge, MA: Harvard University Press, 
1991. p. 264. 
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HIPOTESE 3 


Valor medio do termo de erro e zero: dado o valor de X jt o valor medio ou esperado, do 
termo de erro aleatorio u, e zero. Simbolicamente, temos: 


E(Ui | X,) = 0 (3.2.1) 

ou, se X e nao estocastico, 

E(u,) = 0 


dente a um dado X distribui-se em torno da media (mostrada pelos pontos circulados sobre a FRP), 
com alguns valores de Y acima e outros abaixo da media. As distancias acima e abaixo da media nao 
sao nada mais que os u,. A Equagao (3.2.1) requer que o valor medio desses desvios em relagao a 
qualquer X seja zero. 

Esta hipotese nao e diffcil de entender em vista do que foi discutido na Segao 2.4 (veja a Equagao 
(2.4.5)). A hipotese 3 informa simplesmente que fatores nao inclufdos explicitamente no modelo e, 
portanto, agrupados em u h nao afetam sistematicamente o valor medio de Y; em outras palavras, os 
valores positivos de it,- cancelam os negativos, de modo que seu efeito medio sobre Y e igual a 0. 11 

Note que a premissa E(u, |X,-) = 0 implica que E (1)|X,) = Pi + Pi V- (Por que?) Portanto, as 
duas hipoteses sao equivalentes. 

E importante ressaltar que a Hipotese 3 implica que nao existe vies de especificagao ou erro de 
especificagao no modelo usado na analise empfrica. Em outras palavras, o modelo de regressao esta 
especificado corretamente. Deixar de fora variaveis explanatorias importantes, incluir variaveis 
desnecessarias ou escolher incorretamente a forma funcional da relagao entre as variaveis Y e X sao 
alguns exemplos de erro de especificagao. Discutiremos o topico em detalhe no Capitulo 13. 

Note tambem que, se a media condicional de uma variavel aleatoria dada outra variavel aleatoria 
e zero, a covariancia entre as duas variaveis e zero e, portanto, as duas variaveis nao sao correlacio- 
nadas. Sendo assim, a Hipotese 3 implica que X, e it, nao sao correlacionadas. 12 

A razao para assumir que o termo de erro u e a(s) variavel(eis) explanatoria(s) X nao sao cor- 
relacionados e simples. Quando expressamos a FRP na Equagao (2.4.2), assumimos que Xe u (que 
representa a influencia de todas as variaveis omitidas) tem influencias separadas (e aditivas) sobre 
Y. Mas, s e Xe u sao correlacionados, nao e possfvel avaliar seus efeitos individuals sobre Y. Por¬ 
tanto, seXeu sao positivamente correlacionados, X aumenta quando u aumenta e diminui quando 
u diminui. Da mesma forma, se X e u sao negativamente correlacionados, X aumenta quando u 
diminui e diminui quando u aumenta. Em situagoes como essa, e bem possfvel que o termo de erro 
realmente inclua algumas variaveis que deveriam ser inclufdas como regressores adicionais no 
modelo. E por esse motivo que a Hipotese 3 e outra maneira de afirmar que nao existe erro de 
especificagao no modelo de regressao escolhido. 

A Equagao (3.2.2) informa que a variancia de m, para cada X t (a variancia condicional de a,) e 
um numero positivo constante igual a a 1 . Tecnicamente, a Equagao (3.2.2) representa a premis¬ 
sa da homocedasticidade ou igual (homo) dispersao (cedasticidade) ou variancia igual. A 
palavra tem origem no verbo grego skedanime, que significa dispersar ou espalhar. Em outras palavras, 
a Equagao (3.2.2) indica que as populagoes Y correspondentes aos varios valores de X tem a 
mesma variancia. Simplificando, a variagao em torno da linha de regressao (que e a linha das 
relagoes medias entre YeX) 6 a mesma para todos os X; nao aumenta nem diminui quando X varia. 
A Figura 3.4 representa isso graficamente. 


11 Razoes mais tecnicas para a necessidade da Hipotese 3 podem ser encontradas em MALINVAUD, E. Statistical 
methods of econometrics. Chicago: Rand McNally, 1966. p.75. Veja tambem o Exercfcio 3.3. 

12 O oposto, contudo, nao e verdadeiro porque correlagao e uma medida de associagao linear apenas. Mesmo se 
X, e Uj nao forem correlacionadas, a media condicional de u, dado X„ pode nao ser zero. No entanto, se X, e u, 
forem correlacionadas, f(u,|X ; ) deve ser diferente de zero, o que viola a Hipotese 3. Devemos este argumento a 
Stock e Watson. Veja STOCK, James H.; WATSON, Mark W. Introduction to econometrics. Boston: Addison-Wes- 
ley, 2003. p. 104-105. 
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HIPOTESE 4 


FIGURA 3.4 

Homocedasticidade. 


Homocedasticidade ou variancia constante de «,■: A variancia do termo de erro e a mesma 
independentemente do valor de X. De maneira simbolica, 

var(u,) = E[Uj - £(u,|X ; )] 2 

= £(u 2 |X,), devido a Hipotese 3 
= E(Uj 2 ), se X, e nao estocastica 

= a 2 (3.2.2) 

em que var e a abreviatura de variancia. 


Em contrapartida, considere a Figura 3.5, em que a variancia condicional da populagao de Y varia 
com X. Essa situagao e conhecida, adequadamente, como heterocedasticidade ou dispersdo ou varian¬ 
cia desigual. Simbolicamente, nessa situagao a Equagao (3.2.2) pode ser representada como 

var (m,|Z ( ) = a] (3.2.3) 

Observe o subscrito em er 2 na Equagao (3.2.3), que indica que a variancia da populagao Y nao e mais 
constante. 

Para tornar essa diferenga entre as duas situagoes clara, suponha que Y represente as despesas 
semanais de consumo e X, a renda semanal. As Figuras 3.4 e 3.5 mostram que a medida que a renda 
aumenta, as despesas tambem aumentam. Mas na Figura 3.4 a variancia das despesas de consumo 
permanece a mesma em todos os nfveis de renda, enquanto na Figura 3.5 ela aumenta com o aumen- 
to da renda. Em outras palavras, as famflias mais ricas em media consomem mais do que as famflias 
mais pobres, mas tambem ha maior variabilidade nas despesas de consumo das primeiras. 

Para entender a logica por tras desta hipotese, veja a Figura 3.5. Como ela mostra, var (t/IX,) < 
var(t/|X 2 ),..., < var(w|X,). Portanto, a probabilidade de que as observagoes Y vindas de uma popula¬ 
gao com X — Xi estarao mais proximas da FRP do que as da populagao que corresponde a X — X 2 , 
X — X 3 e assim por diante. Em resumo, nem todos os valores Y correspondentes aos varios X serao 
igualmente confiaveis; essa confiabilidade e avaliada pela proximidade ou distancia em que os valo¬ 
res de Y distribuem-se em torno de sua media, isto e, os pontos sobre a FRP. Se esse for de fato o caso, 
nao seria preferfvel tirar a amostra de populagoes Y que estejam mais proximas da media do que da- 
quelas que estao mais dispersas? Mas fazer isso pode restringir a variagao que obtemos entre os va¬ 
lores de X. 

Ao invocarmos a Hipotese 4, estamos dizendo que, neste estagio, todos os valores de Y correspon¬ 
dentes aos varios Xsao igualmente importantes. No Capitulo 11, veremos o que acontece quando nao 
e esse o caso, isto e, quando ha heterocedasticidade. 
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FIGURA 3.5 

Heterocedasticidade. 
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Note que a Hipotese 4 implica que as variancias condicionais de Y, tambem sao homocedasticas. 
Isto e, 


var (Y t | Xj) = a 2 (3.2.4) 

Obviamente, a variancia incondicional de Y e erf. Mais adiante, veremos a importancia de fa- 
zer a distingao entre as variancias condicional e incondicional de Y (veja no Apendice A deta- 
lhes das variancias condicional e incondicional). 


HIPOTESE 5 Nao ha autocorrela^ao entre os termos de erro: dados quaisquer dois valores de X, X, e X ( 

(i j), a correlagao entre quaisquer dois u, e Uj (i j) e zero. Simbolicamente, 

cov(u„ Uj | X, e Xj) = 0 (3.2.5) 

cov(u„ uj) = 0, se X for nao estocastica 

em que / e j sao duas observagoes diferentes e cov significa covariancia. 


Em palavras, a Equagao (3.2.5) postula que os termos de erro u, e Uj nao sao correlacionados. 
Tecnicamente, esta e a hipotese de ausencia de correlacao serial ou de ausencia de autocorrelacao. 
Isso significa que, dado X h os desvios de quaisquer dois valores de Y em relagao a sua media nao 
apresentam padroes como os das Figuras 3.6(a) e (/;). Na Figura 3.6(a), vemos que ha uma correlagao 
positiva entre os u : um u positivo seguido de um u positivo ou um u negativo seguido de outro ne- 
gativo. Na Figura 3.6 (b), os u apresentam uma correlagao negativa: um u positivo seguido de outro 
negativo e vice-versa. 

Se os termos de erro (desvios) seguem padroes sistematicos, como os das Figuras 3.6(a) e (b), ha 
autocorrelagao ou correlagao serial e a Hipotese 5 requer que tais correlagoes estejam ausentes. A 
Figura 3.6(c) mostra que nao ha um padrao sistematico nos u, o que indica uma correlagao zero. 

A importancia desta hipotese sera explicada em detalhes no Capftulo 12, mas e possfvel explica-la 
intuitivamente do seguinte modo. Suponha que, em nossa FRP (Y, = /f i + /f 2 X, + uj), u, e u t _ l sejam 
positivamente correlacionados. Entao, V, depende nao apenas de X,, mas tambem de u,_ h pois u t _ l 
ate certo ponto determina it,. Neste estagio de nossa formulagao, ao invocarmos a Hipotese 5 estamos 
dizendo que consideraremos o efeito sistematico, se houver, de X, sobre Y, e nao nos preocuparemos com 
outras influencias que possam pesar sobre Y como resultado da possfvel intercorrelagao entre os u. Mas, 
conforme observado, no Capftulo 12 veremos como as intercorrelagoes entre os termos de erro po- 
dem ser introduzidas na analise e quais sao as consequencias. 
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FIGURA 3.6 
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Mas devemos acrescentar aqui que a justificativa para esta hipotese depende do tipo de dados 
usados na analise. Se os dados forem de corte transversal e forem obtidos como uma amostra aleato- 
ria da populanao, esta hipotese sera normalmente valida. Entretanto, se os dados sao de series tem- 
porais, a hipotese de independencia e diffcil de manter, pois observa 5 oes sucessivas de uma serie 
temporal, como o P1B, sao altamente correlacionadas. Mas trataremos desta situapao quando exami- 
narmos series temporais mais adiante no livro. 


HIPOTESE 6 O numero de observances n deve ser maior que o numero de parametros a serem 
estimados: como alternativa, o numero de observafoes n deve ser maior que o numero de varia¬ 
veis explanatorias. 


HIPOTESE 7 Variabilidade dos valores de X : os valores de X em uma amostra nao devem ser os mesmos. 

Tecnicamente, var (X) deve ser um numero positivo. Alem disso, nao pode haver valores extre- 
mos ( outliers ) da variavel X, isto e, valores muito grandes ou discrepantes em relagao ao resto 
das observances. 


Esta hipotese nao e tao inocua quanto parece. No exemplo hipotetico da Tabela 3.1, imagine que 
so tivessemos o primeiro par de observances de Y e X (4 e 1). Com base nessa unica observanao, nao 
ha como estimar as duas incognitas /i, e /J 2 - Sao necessarios pelo menos dois pares de observances 
para estimar as duas incognitas. Em um capitulo posterior, veremos a importancia fundamental desta 
hipotese. 

Esta hipotese tambem nao e tao inocua quanto parece. Veja a Equafao (3.1.6). Se todos os valores 
de X forem identicos, entao X, — X (por que?) e o denominador da equaqao sera zero, tornando 
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impossrvel estimar /3 2 e, portanto, j>\. Intuitivamente, podemos ver por que esta hipotese e tao impor- 
tante. Voltando ao exemplo das despesas de consumo familiar do Capitulo 2, se houver pouca varia- 
£ao na renda das famflias, nao seremos capazes de explicar boa parte da varia 9 ao dos gastos com 
consumo. O leitor deve ter em mente que a variaqao tanto de Y quanto de X e essencial para o uso da 
analise de regressao como uma ferramenta de pesquisa. Resumindo, as variaveis precisam variar! 

A exigencia de que nao haja valores extremos para a variavel X e para evitar que os resultados da 
regressao sejam dominados por esses valores extremos. Se existirem alguns poucos valores de X que 
sao, por exemplo, 20 vezes a media dos valores de X, as linhas de regressao estimadas com ou sem 
tais observa 5 oes serao consideravelmente diferentes. Com frequencia os valores extremos sao resul- 
tado de erros humanos de aritmetica ou da mistura de amostras de diferentes popula 9 oes. No Capftu- 
lo 13, discutiremos o topico em mais detalhes. 

Nossa discussao sobre as hipoteses subjacentes ao modelo classico de regressao linear agora esta 
completa. E importante destacar que todas essas hipoteses aplicam-se apenas a funcjao de regressao 
populacional, nao a fun 9 ao de regressao amostral. Contudo, e interessante observar que o metodo dos 
mmirnos quadrados examinado anteriormente possui algumas propriedades similares as hipoteses 
da FRP. Por exemplo, a conclusao de que = Oe, portanto, u — 0 6 semelhante a premissa 
E(ui\Xj) = 0. Do mesmo modo, a conclusao de que jju, A, = 0 e semelhante a covfiq, X,) — 0. E re- 
confortante notar que o metodo dos minimos quadrados tenta “duplicar” algumas das premissas que 
impusemos a FRP. 

E claro, a FRA nao duplica todas as premissas do modelo classico de regressao linear. Como 
mostraremos mais adiante, embora cov(iq, uj — 0 (/ yf j) por defin^ao, nao e verdadeiro que, na 
amostra, cov (u„ uj) = 0 (/ / j). Na realidade, mostraremos mais adiante que os resfduos sao nao so 
autocorrelacionados, como tambem heterocedasticos (veja o Capitulo 12). 

Um comentario a respeito dessas hipoteses 

A pergunta fundamental e: ate que ponto todas essas hipoteses sao realistas? A “realidade das hipo¬ 
teses” e uma questao antiga na filosofia da ciencia. Alguns argumentam que nao importa se sao realis¬ 
tas; o que importa sao as previsoes feitas com base nelas. Um notavel dentre os defensores da “tese da 
irrelevancia das hipoteses” e Milton Friedman. Para ele, a irrealidade das premissas e uma vantagem 
positiva: “para ser importante [...] uma hipotese deve ser descritivamente falsa em suas premissas”. 13 

Podemos nao concordat plenamente com esse ponto de vista, mas lembre-se de que em qual- 
quer estudo cientifico fazemos certas suposi 9 oes porque facilitam o desenvolvimento do assunto 
em etapas graduais, e nao porque sejam necessariamente realistas no sentido de replicar a realidade 
com exatidao. 

Como um autor observa: “[...] se a simplicidade e um criterio desejavel da boa teoria, todas as 
boas teorias idealizam e simplificam exageradamente”. 14 

O que planejamos fazer e, primeiro, estudar minuciosamente as propriedades do MCRL e, em 
capltulos posteriores, examinar com profundidade o que acontece quando as hipoteses da MCRL nao 
sao atendidas. No final deste capitulo, apresentamos na Tabela 3.4 um guia que mostra onde verificar 
o que acontece com o modelo classico de regressao linear se dada hipotese nao for satisfeita. 

Como um colega ressaltou, quando examinamos pesquisas feitas por outras pessoas, precisamos 
considerar se as hipoteses feitas pelo pesquisador sao adequadas aos dados e ao problema. Com mui- 
ta frequencia, as pesquisas publicadas se embasam em hipoteses implfcitas sobre o problema e em 
dados que provavelmente nao estao corretos e produzem estimativas baseadas nessas hipoteses. Evi- 
dentemente, o leitor atento deveria, ao perceber esse problema, adotar uma atitude cetica em rela 9 ao 
a pesquisa. As hipoteses apresentadas na Tabela 3.4 proporcionam uma lista de verifica 9 ao para 
orientar nossas pesquisas e avaliar as de terceiros. 


13 FRIEDMAN, Milton. Essays in positive economics. Chicago: University of Chicago Press, 1953. p. 14 

14 BLAUG, Mark. The methodology of economics: or how economists explain. 2. ed. Nova York: Cambridge University 
Press, 1992. p. 92. 
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Com esse pano de fundo, estamos agora prontos para estudar o modelo classico de regressao 
linear. Em especial, queremos verificar as propriedades estatisticas dos MQO em comparagiao 
com as propriedades puramente matematicas que examinamos anteriormente. As propriedades 
estatisticas dos MQO embasam-se nas hipoteses do modelo classico de regressao linear ja exami- 
nadas e estao inseridas no famoso teorema de Gauss-Markov. Mas, antes de passarmos a esse teore- 
ma, que fornece a justificativa teorica para a popularidade dos MQO, precisamos, primeiro tratar 
da precisao ou dos erros padrao das estimativas de mmimos quadrados. 


3.3 Precisao ou erros padrao das estimativas de mmimos quadrados 

Ao analisarmos as Equates (3.1.6) e (3.1.7), fica evidente que as estimativas de mmimos quadra¬ 
dos sao uma t’uncao dos dados amostrais. Mas como os dados costumam mudar de amostra para 
amostra, consequentemente as estimativas mudarao. Portanto, alguma medida de “confiabilidade” ou 
precisao dos estimadores ^ e /C faz-se necessaria. Em estatfstica, a precisao de uma estimativa e 
medida por seu erro padrao (ep). 15 Dadas as hipoteses gaussianas, a Segao 3A.3 do Apendice 3A 
mostra que os erros padrao das estimativas de MQO podem ser obtidos como se segue: 


- a 

var (fc) = 2 

E*r 

(3.3.1) 

ep(/*2) - ,- 

(3.3.2) 

var 0§i)= 

(3.3.3) 

epOSi) = 

V 

(3.3.4) 


em que var = variancia, ep = erro padrao e a 2 e a variancia constante ou homocedastica de «, da 
Hipotese 4. 

Todas as quantidades que entram nas equagoes anteriores, exceto a 2 , podem ser estimadas com 
base nos dados. Como mostra a Segao A.5 do Apendice 3A, o proprio a 2 e estimado pela seguinte 
formula: 


a 2 = 



(3.3.5) 


em que a 2 e o estimador de MQO do verdadeiro, mas desconhecido, a 2 , a expressao n — 2 e conhecida 
como numero de graus de liberdade (gl) e V;/, 2 e a soma do quadrado dos residuos (SQR) 16 . 


ls O erro padrao e apenas o desvio padrao da distribuigao amostral do estimador, e esta e simplesmente a proba- 
bilidade ou distribuigao de frequencia do estimador; isto e, uma distribuigao do conjunto de valores dos estima¬ 
dores obtidos de todas as amostras possfveis, do mesmo tamanho, de uma dada populagao. As distribuigoes 
amostrais sao usadas para fazer inferencias sobre os valores dos parametros populacionais com base nos valores 
calculados dos estimadores baseados em uma ou mais amostras. (Para detalhes, veja o Apendice A.) 

16 A expressao numero de graus de liberdade representa o numero total de observagoes da amostra 
(= r ) menos o numero de restrigoes independentes (lineares) impostas a ele. Em outras palavras, e o nume¬ 
ro de observagoes independentes dentre um total de n observagoes. Por exemplo, antes de calcular a SQR 
(3.1.2), e preciso obter fa e fa- Sendo assim, essas duas estimativas impoem duas restrigoes a SQR. Portanto, 
existem n — 2, e nao n, observagoes independentes para calcular a SQR. Seguindo essa logica, em uma regres¬ 
sao com tres variaveis, a SQR tera n — 3 graus de liberdade e o modelo com k variaveis tera n — k graus de li¬ 
berdade. A regra geral e a seguinte: graus de liberdade = (n — numero de parametros estimados). 
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Uma vez conhecida ^uf, a 2 pode ser facilmente calculado. A propria JA/, 2 pode ser calculada 
por meio da Equagao (3.1.2) ou da seguinte expressao (veja a prova na Segao 3.5): 

(3.3.6) 

Comparada a Equagao (3.1.2), a Equagao (3.3.6) e facil de usar, pois nao requer o calculo de u, 
para cada observagao, embora esse calculo possa ser util (como veremos nos Capftulos lie 12). 
Como 


E-fr?/ 

E *, 2 


uma expressao alternativa para calcular ^juf e: 




(E-ta,)" 

E *, 2 


(3.3.7) 


Note que a raiz quadrada positiva de a 2 



(3.3.8) 


e conhecida como erro padrao da estimativa ou erro padrao da regressao (ep). E simplesmente o 
desvio padrao dos valores de Y em relagao a linha de regressao estimada, sendo frequentemente usada 
como uma medida sintetica da “qualidade do ajustamento” da linha de regressao estimada, um topico 
que sera discutido na Segao 3.5. 

Anteriormente, observamos que, dado X h a 2 representa a variancia (condicional) de u, e de Y r 
Portanto, o erro padrao da estimativa pode tambem ser chamado de desvio padrao (condicional) de u, 
e Yj. Obviamente, como sempre, ay e o Y representam, respectivamente, a variancia incondicional e o 
desvio padrao incondicional de Y. 

Note as seguintes caracterfsticas das variancias (e, portanto, dos erros padrao) de /l, e fiy. 

1. A variancia de & diretamente proporcional a a 2 , mas inversamente proporcional a '^x 2 . Isto e, 
dado a 2 , quanto maior a variagao dos valores de X, menor a variancia de /J 2 e, portanto, maior a 
precisao com que ( J > 2 pode ser estimado. Resumindo, dado cr, se houver variagao substancial dos 
valores de X, fi 2 pode ser medido mais acuradamente do que quando os X ,■ nao variant substancial- 
mente. Tambem, dada ]Cx 2 . quanto maior a variancia de a 2 , maior a variancia de fi 2 . Note que, 
conforme o tamanho da amostra n aumentar, o numero de termos na somatoria aumentara. 
Com o aumento de n, a precisao da estimagao de (i 2 tambem aumenta. (Por que?) 

2. A variancia de e diretamente proporcional a a 2 e £Tt 2 , mas inversamente proporcional a 
e ao tamanho da amostra n. 

3. Como /l] e f J > 2 sao estimadores, eles nao so variam de amostra para amostra, como tendem a ser 
dependentes um do outro em determinada amostra. Essa dependencia e medida pela covariancia 
entre eles. Na Segao 3A.4 do Apendice 3A, vemos que: 


cov (3i, fh) = -Xvxcifa) 



(3.3.9) 
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Como var (/f 2 ) e sempre positiva, assim como a variancia de qualquer variavel, a natureza da co- 
variancia entre fi\ e /ft depende do sinal de X. Se o sinal for positivo, como mostra a formula, a cova- 
riancia sera negativa. Portanto, se o coeficiente angular /ft for superestimado (se a inclinagao for muito 
abrapta), o intercepto /i, sera subestimado (o intercepto sera pequeno demais). Mais a frente (especial- 
mente no Capitulo 10, sobre multicolinearidade), veremos a utilidade de examinar as covariancias 
entre os coeficientes de regressao estimados. 

Como as variancias e os erros padrao dos coeficientes estimados de regressao nos permitem julgar 
a confiabilidade dessas estimativas? Isso e um problema de inferencia estatistica e sera visto nos 
Capttulos 4 e 5. 


3.4 Propriedades dos estimadores de mmimos quadrados: o teorema 

1 m 

de Gauss-Markov 

Como mencionado, dadas as hipoteses do modelo classico de regressao linear, as estimativas de 
mmimos quadrados possuem algumas propriedades ideais ou otimas. Estas estao contidas no conhe- 
cido teorema de Gauss-Markov. Para entende-lo, precisamos considerar a propriedade de melhor 
estimador linear nao viesado (ou nao tendencioso): MELNT ou BLUE de um estimador. 18 Como 
explicado no Apendice A, um estimador, por exemplo, o estimador de MQO /ft, e considerado o melhor 
estimador linear nao viesado (ou nao tendencioso) de /ft se atender as seguintes condigoes: 

1. E linear, isto e, uma fungao linear de uma variavel aleatoria, como a variavel dependente Y no 
modelo de regressao. 

2. E nao viesado (ou nao tendencioso), isto e, seu valor medio ou esperado E(j3 2 ) e igual ao 
verdadeiro valor /3 2 . 

3. Tem variancia minima na classe de todos os estimadores lineares nao viesados; um esti¬ 
mador nao viesado com a menor variancia e conhecido como um estimador eficiente. 

No contexto da regressao, podemos provar que os estimadores de MQO sao MELNT. Essa e a 
essencia do famoso teorema de Gauss-Markov, que afirma o seguinte: 


Teorema de Dadas as premissas do modelo classico de regressao linear, os estimadores de mfnimos quadrados 

Gauss-Markov c * a c l asse dos estimadores lineares nao viesados tem variancia minima, isto e, sao o melhor estima¬ 

dor linear nao viesado (MELNT). 


A demonstragao deste teorema esta na Segao 3A.6 do Apendice 3A. Toda a importancia do teore¬ 
ma ficara mais clara a medida que avangarmos. Por enquanto, e suficiente notar que o teorema tem 
importancia nao so teorica como tambem pratica. 19 

Podemos explicar o significado de tudo isso com auxilio da Figura 3.7. 

Na Figura 3.7 (a) apresentamos a distribuigao amostral do estimador de MQO /) 2 , isto e, a distri- 
buigao dos valores assumidos por /L em experimentos amostrais repetidos (lembre-se da Tabela 3.1). 


17 Embora conhecido como teorema de Gauss-Markov, a abordagem de Gauss (1821) aos minimos quadrados 
antecede a de variancia minima de Markov (1900). 

18 O leitor encontrara no Apendice A consideragoes sobre a importancia dos estimadores lineares, bem como 
um exame geral das propriedades desejaveis dos estimadores estatisticos. 

19 Por exemplo, e possivel demonstrar que qualquer combinagao linear dos p, como (/t|— 2/i 2 ), pode ser estima- 
da por meio de (ft — 2ft) e que seu estimador e o melhor estimador linear nao viesado. Para detalhes, veja, 
HENRY, Theil. Introduction to econometrics. Englewood Cliffs, N. J.: Prentice-Hall, 1978. p. 401-402. Uma obser- 
vagao tecnica sobre o teorema de Gauss-Markov: ele so proporciona a condigao suficiente (mas nao necessaria) 
para a eficiencia dos MQO. Agradego a Michael McAleer, da Western Australia University, por chamar nossa 
atengao para este ponto. 
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FIGURA 3.7 

Distribuigao amostral 
do estimador de MQO 
P 2 de um estimador 
alternativo /S* 



E(A) = A 

( a) Distribute) amostral /J 2 



(b) Distribuicao amostral ft* 



(c) Distribuigao amostral de fi 2 e 


Por conveniencia, supusemos que os /S 2 distribuem-se simetricamente (mas voltaremos a este ponto 
no Capitulo 4). Como a figura mostra, a media dos valores de (i 2 , E(/3 2 ), e igual ao verdadeiro P 2 . 
Nessa situagao, dizemos que /0 2 e um estimador ndo viesado de /3 2 . Na Figura 3.1(b), mostramos a 
distribuigao amostral de fi 2 , um estimador alternativo de fi 2 obtido usando outro metodo (diferente de 
MQO). Por conveniencia, supusemos que assim como f J > 2 , e nao viesado, ou seja, que seu valor 
medio ou esperado e igual a ft 2 . Vamos supor, ainda, que tanto ft 2 quanto ft' 2 sao estimadores lineares, 
isto e, que sao fun 5 oes lineares de Y. Qual dos estimadores, fi 2 ou fi 2 , voce escolheria? 

Para responder a essa pergunta, sobrcponlia as duas figuras, como na Figura 3.7(c). E obvio que, 
embora tanto /S 2 quanto sejam nao viesados, a distribu^ao de ft ’ 2 e mais difusa ou espalhada em 
tomo da media do que a distribuigao de fi 2 . Em outras palavras, a variancia de ft% e maior que a varian- 
cia de fi 2 . Agora, dados dois estimadores lineares e nao viesados, escolhemos o estimador com menor 
variancia a mais, porque e mais provavel que esteja mais proximo de ( J > 2 do que o estimador alterna¬ 
tivo. Em resumo, escolhemos o melhor estimador linear nao viesado (MELNT ou BLUE). 

O teorema de Gauss-Markov e notavel, porque nao faz suposigoes sobre a distribuigao de proba- 
bilidade da variavel aleatoria u i e, portanto, de Y, (no proximo capitulo, voltaremos ao assunto). En- 
quanto as hipoteses do modelo classico de regressao linear forem atendidas, o teorema sera valido. 
Consequentemente, nao precisamos procurar outro estimador linear nao viesado, pois nao encontra- 
remos um cuja variancia seja menor que o estimador de minimos quadrados ordinarios. E claro, se 
uma ou mais dessas hipoteses nao se aplicarem, o teorema deixa de ser valido. Por exemplo, se con- 
siderarmos os modelos de regressao nao linear nos parametros (discutidos no Capitulo 14), podere- 
mos encontrar estimadores melhores que os estimadores de MQO. Tambem, como veremos no 
capitulo sobre heterocedasticidade, se a hipotese de variancia homocedastica nao for satisfeita, os 
estimadores de MQO, embora nao viesados e consistentes, deixam de ser estimadores com variancia 
minima mesmo na classe dos estimadores lineares. 
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As propriedades estatfsticas que acabamos de examinar sao conhecidas como propriedades de 
amostras Anitas: elas sao validas independentemente do tamanho da amostra em que os estimadores 
se embasam. Mais adiante, teremos oportunidade de considerar as propriedades assintoticas, isto e, 
as propriedades que se mantem apenas se o tamanho da amostra for muito grande (tecnicamente, in- 
Anito). O Apendice A apresenta uma discussao geral das propriedades dos estimadores de amos¬ 
tras Anitas e dos de grandes amostras. 


3.5 O coeficiente de determina^ao r 2 : uma medida da 
“qualidade do ajustameiito” 

Ate aqui estivemos preocupados com o problema de estimar coeAcientes de regressao, seus erros 
padrao e algumas de suas propriedades. Agora, consideraremos a qualidade do ajustamento da linha 
de regressao ajustada a um conjunto de dados; vamos descobrir quao “bem” uma linha de regressao 
amostral e adequada aos dados. A Figura 3.1 deixa claro que, se todas as observagoes fossem situadas 
na linha de regressao, obteriamos um ajustamento “perfeito”, mas isso raramente acontece. Em geral, 
havera alguns u i positivos e outros ii, negativos. O que esperamos e que esses residuos em torno da 
linha de regressao sejam os menores possiveis. O coeAciente de determinagao r 2 (no caso de duas 
variaveis) ou R 2 (regressao multipla) e uma medida resumida que diz quanto a linha de regressao 
amostral ajusta-se aos dados. 

Antes de mostrarmos como se calcula o r 2 , vejamos uma explicagao heuristica de r 2 em termos de 
um recurso graAco conhecido como diagrama de Venn, ou Ballentine, como mostra a Figura 3.8. 20 

Nessa Agura, o circulo Y representa a variagao da variavel dependente feo cfrculo X, a variagao 
da variavel explanatoria X 21 A sobreposigao dos cfrculos (a area sombreada) indica a extensao em 
que a variagao de Y e explicada pela variagao de X (por exemplo, por meio de uma regressao de 
MQO). Quanto maior a area de sobreposigao, maior a parte da variagao de Y explicada por X. O r 1 e 
apenas a medida numerica dessa sobreposigao. Na Agura, a medida que nos movemos da esquerda 
para a direita, a area de sobreposigao aumenta, isto e, uma proporgao cada vez maior da variagao de Y 
e explicada por X. Em resumo, r 2 aumenta. Quando nao ha sobreposigao, r 2 e obviamente zero; mas, 
quando a sobreposigao e total, r 2 e igual a 1, pois 100% da variagao de Y e explicada por X. Como 
mostraremos em breve, r 2 situa-se entre 0 e 1. 

Para calcularmos r 2 , procedemos do seguinte modo. Lembre-se de que: 

Yj = Y t + u i (2.6.3) 


FIGURA 3.8 

r visto no Ballentine: 
(a) r = 0; (f) r 2 = 1. 




_ (d) (e) (/) 

20 Veja KENNEDY, Peter. "Ballentine: a graphical aid for econometrics." Australian Economics Papers, 1981. v. 20, 
p. 414-416. O nome Ballentine faz referenda aos cfrculos da logomarca de uma famosa cerveja com esse 
nome. 

21 Os termos variagao e variancia indicam coisas diferentes. A variagao e a soma dos quadrados dos desvios de 
uma variavel de seu valor medio. A variancia e a soma dos quadrados dividida pelos graus de liberdade adequa- 
dos. Em resumo, variancia = variagao/gl. 
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ou, no formato de desvio, 


yt = 9i + Ui 


em que se faz uso das Equagoes (3.1.13) e (3.1.14). Elevando ao quadrado os dois lados da Equagao 
(3.5.1) e somando na amostra, obtemos 


= E* 2 +I>* (3 - 5 - 2) 

= pi J2 x <+12 


j a que J2 >’i “ i = 0 (por que?) e = Pi *;■ 

As varias somas de quadrados que aparecem na Equagao 3.5.2 podem ser descritas como a seguir: 
^2 y 2 = ^( Yj — Y) 2 — variagao total dos valores observados de Y em torno de sua media amostral, 
que pode ser chamada de soma total de quadrados (STQ). — Y) 1 = J2^i ~ = Pi 

22 x f = variagao dos valores estimados de Y em torno de sua media (Y— Y), que, apropriadamente, 
pode ser chamado de soma dos quadrados devido a regressao (isto e, devido a(s) variavel(is) 
explanatoria(s)) ou simplesmente a soma dos quadrados explicados pela regressao. ^uf — varia¬ 
gao residual ou inexplicada dos valores de Y em relagao a linha de regressao, ou simplesmente soma 
dos quadrados dos resfduos (SQR). Portanto, a Equagao (3.5.2) e 

STQ = SQE + SQR (3.5.3) 

e mostra que a variagao total dos valores observados de Y em tomo de sua media pode ser dividida em 
duas partes, uma atribuivel a linha de regressao e a outra a forgas aleatorias, porque nem todas as obser- 
vagoes efetivas de Y situam-se sobre a linha ajustada. Podemos ver isso geometricamente na Figura 3.9. 

Dividindo os dois lados da Equagao (3.5.3) por STQ, obtemos 

, SQE SQR 

1 —-b - 

STQ STQ 

= EM ~ T ) 2 £«) (3 ‘ 5 ‘ 4) 

E(Y, - Y ) 2 E(Yi - Y ) 2 


FIGURA 3.9 

Separagao da 
variagao de Yj em 
dois componentes. 
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Agora definindo r 2 como 


ou como 


2 = W - Y) 2 = SQE 
J2(Yi ~ Y ) 2 STQ 


(3.5.5) 



(3.5.5 a) 


O valor de r 2 assim definido e conhecido como coeflciente de determinagao (amostral) e e o indica- 
dor mais usado para medir a qualidade do ajustamento de uma linha de regressao. Em palavras, r 2 
mede a proporgao ou percentual da variagao total de Y explicada pelo modelo de regressao. 

Duas propriedades de r 2 devem ser destacadas: 


1. E um valor nao negativo. (Por que?) 

2. Seus limites sao 0 < r 2 < 1 . Um r 2 igual a 1 significa um ajustamento perfeito, isto e, Y\ — 
Y t para cada i. Por outro lado, um r 2 igual a zero significa que nao ha qualquer rela^ao entre 
regressando e regressor (fi 2 — 0). Nesse caso, como mostra a Equagao (3.1.9), Y t — /!, = Y, 
a melhor previsao para qualquer valor de Y e seu valor medio. Nessa situagao, a linha de 
regressao sera horizontal ao eixo dos X. 

Embora r 2 possa ser calculado diretamente da definigao da Equagao (3.5.5), ele pode ser obtido 
mais rapidamente com a seguinte formula: 


SQE 

STQ 



4 2 Z >, 2 

E yf 



(3.5.6) 


Se dividirmos o numerador e o denominador da Equagao (3.5.6) pela amostra de tamanho n (ou por 
n — 1 se o tamanho da amostra for muito pequeno), obtemos: 



em que S 2 e S 2 sao as variancias amostrais de Y e X, respectivamente. 

Como — E x *yi /E- v ; 2 ’ a Equagao (3.5.6) tambem pode ser expressa como 


(3.5.7) 


r 


2 


(E-tj /) 2 

Eu 2 E.v 2 


(3.5.8) 


que pode ser facil de calcular. 
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Dada a definigao de r 2 , podemos expressar SQE e SQR, discutidas anteriormente, como se segue: 


SQE= r ■ STQ 


= r2 E 


y-, 


Portanto, podemos escrever 


SQR= STQ- STE 

= STQ( 1 - SQE/STQ) 

STQ = SQE+SQR 

E ^- 2 £, 2 + ( i -, 2 ) I > 2 


(3.5.9) 

(3.5.10) 


(3.5.11) 


uma expressao que nos sera muito utd mais adiante. 

Algo estreitamente relacionado, mas conceitualmente muito diferente de r 2 , e o coefieiente de 
correlacao, que, como foi visto no Capftulo 1, e uma medida do grau de associa§ao entre duas varia- 
veis. Pode ser calculado tanto por 

r — ± ^r 2 


(3.5.12) 


ou, com base em sua defini^ao: 


E ■*<}’< 


y<E^)(E-v?) 

nE^ y .-(E^)(E y /) 

7[»EE 2 -(E^) 2 ][«E^ 2 -(E^) 2 ] 


(3.5.13) 


22 


que e conhecido como coefieiente de correlacao amostral 

Estas sao algumas das propriedades de r (veja a Figura 3.10): 


1. Pode ser positivo ou negativo, o que dependera do sinal do termo no numerador da Equagao 
(3.5.13), que mede a covariagdo amostral das duas variaveis; 

2. Se situa entre os limites de —1 e +1, isto e, —1 < r < 1. 

3. Sua natureza e simetrica, isto e, o coefieiente de correlacao entre X e Y (r XY ) e o mesmo que 
aquele entre Ye X ( ryx )■ 

4. E independente da origem e da escala, isto e, se definimos Xf — a X t + C e Yf — b Y, + d, 
onde a > 0, b > 0 e c e d sao constantes, entao o r entre X* e Y* e o mesmo que aquele entre 
as variaveis originais X e Y. 

5. Se X e Y sao estatisticamente independentes (veja a definicao no Apendice A), o coefieiente de 
correlacao entre elas e zero, mas se r = 0, isso nao significa que as variaveis sejam independentes. 
Em outras palavras, correlacao zero nao implica necessariamente independencia (veja Figura 
3.10(/z)). 

6. E uma medida de associacdo linear ou de dependencia linear, nao e significativa para descre- 
ver relacoes nao lineares. Assim, na Figura 3.10 (h), Y — X 2 e uma relacao exata, embora r 
seja zero. (Por que?) 

7. Mesmo sendo uma medida de associacao linear entre duas variaveis, ela nao implica necessa¬ 
riamente qualquer relacao de causa e feito, como observado no Capftulo 1. 


22 


O coefieiente de correlagao populacional denotado por p, e definido no Apendice A. 
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No contexto da regressao, r 2 e uma medida mais significativa que r, pois a primeira nos indica a 
proporgac da variagac da variavel dependente explicada pela(s) variavel(is) explanatoria(s) e, portan- 
to, proporciona uma medida geral da extensao em que a variagao de uma variavel determina a varia¬ 
gao de outra. Ja r nao tem esse valor. 23 Alem disso, como veremos, a interpretagao de r ( — R) em um 
modelo de regressao multiplo e de valor duvidoso. No entanto, falaremos mais de r 2 no Capftulo 7. 

Note que or 2 definido anteriormente tambem pode ser calculado como o coeficiente de correla- 
gao entre o Y t obsen’ado e o Y t estimado elevado ao quadrado, especificamente, Y r Usando a Equa 5 ao 
(3.5.13) podemos escrever 


Isto e, 


2 _ [^(Y, - Y)(Y; - Y)f 
W ~ Y) 2 £(Y, - Y) 2 


2 (E.y/y /) 3 

' (Ey, 2 )(Lyr) 


(3.5.14) 


em que Y t — Y observado, Y, — Y estimado, e Y = Y = media de Y. Para uma demonstragao, veja o 
Exercicio 3.15. A Equagao (3.5.14) justifica a descrigao de r 2 como uma medida de qualidade de ajusta- 
mento, pois nos diz quanto os valores estimados de Y estao proximos de seus valores observados. 


FIGURA 3.10 

Padroes de correlagao 
(adaptado de Theil, 
Henri. Introduction to 
econometrics. 
Englewood Cliffs, 
N.J.: Prentice Hall, 
1978. p. 86.) 


Y Y Y 


r = +1 


r = —1 




(a) 


(b) 

Y 

r proximo de -1 


f Y 

r positivo, mas 

proximo de zero 

* / 


• 



• 




(d) 


(e) 

Y 


Y 


r proximo de +1 


(c) 


r negativo, mas 
proximo de zero 


(f) 



Y = X 2 
mas r = 0 






23 


- X 

(g) 


- X 

(h) 


No modelo da regressao, a teoria subjacente indica a diregao de causalidade entre Ye X, que, no contexto dos 
modelos de uma unica equagao, e em geral de X para Y. 
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3.6 Um exemplo numerico 

Ilustraremos a teoria econometrica apresentada ate agora considerando os dados fornecidos na Tabela 
2.6, que relaciona o salario-hora medio ( Y ) com a escolaridade (X). A teoria economica basica do trabalho 
nos informa que, dentre muitas variaveis, a escolaridade e um determinante importante dos salarios. 

Na Tabela 3.2. fornecemos os dados brutos necessarios para estimar o impacto quantitative dos 
anos de estudo nos salarios. 


TABELA 3.2 

Dados brutos com 
base na Tabela 2.6 


Obs 

Y 

X 

X 

Y 

x? 

YiX; 

1 

4,4567 

6 

6 

4,218 

36 

25,308 

2 

5,77 

7 

5 

2,9047 

25 

14,5235 

3 

5,9787 

8 

4 

2,696 

16 

10,784 

4 

7,3317 

9 

3 

1,343 

9 

4,029 

5 

7,3182 

10 

2 

1,3565 

4 

2,713 

6 

6,5844 

11 

1 

2,0903 

1 

2,0903 

7 

7,8182 

12 

0 

0,8565 

0 

0 

8 

7,8351 

13 

1 

0,8396 

1 

0,8396 

9 

11,0223 

14 

2 

2,3476 

4 

4,6952 

10 

10,6738 

15 

3 

1,9991 

9 

5,9973 

11 

10,8361 

16 

4 

2.1614 

16 

8,6456 

12 

13,615 

17 

5 

4,9403 

25 

24,7015 

13 

13,531 

18 

6 

4,8563 

36 

29,1378 

Soma 

112,7712 

156 

0 

0 

182 

1 31,7856 


Obs 

xj 

Yf 

E 

U;=Y;-Y 

uf 

1 

36 

19,8621 7 

4,165294 

0,291406 

0,08491 7 

2 

49 

33,2929 

4,916863 

0,853137 

0,727843 

3 

64 

35,74485 

5,668432 

0,310268 

0,096266 

4 

81 

53,75382 

6,420001 

0,911699 

0,831195 

5 

100 

53,55605 

7,17157 

0,14663 

0,0215 

6 

121 

43,35432 

7,923139 

-1,33874 

1,792222 

7 

144 

61,12425 

8,674708 

-0,85651 

0,733606 

8 

169 

61,38879 

9,426277 

-1,59118 

2,531844 

9 

196 

121,4911 

10,17785 

0,844454 

0,713103 

10 

225 

113,93 

10,92941 

-0,25562 

0,065339 

11 

256 

117,4211 

11,68098 

-0,84488 

0,713829 

12 

289 

185,3682 

12,43255 

1,182447 

1,398181 

13 

324 

183,088 

13,18412 

0,346878 

0,120324 

Soma 

2054 

1083,376 

112,7712 

~0 

9,83017 


Not a: 

Xi 


f>2 

h 


Xi - X- y t = Y i = Y 
131,7856 

£ x? ~ 182,0 “ 


0,7240967 


Y - j} 2 X = 8,674708 - 0,7240967*12 = -0,01445 


£« 2 9,83017 

a 2 = - = -2-^ ; — = 0,893652; a = 0,945332 


n — 2 


var(ft) = ii? 


ii 

0,893652 
: 182,0 
Sur 


= 0,004910; ep06 2 ) = 0,00490 = 0,070072 

9,83017 


ri = 1- = 1 - = 0,9065 

E(T-F) 2 105,1188 

r= r 2 = 0,9521 


var(/3i) = 


Xxf 


2054 


nYixf 13(182) 


= 0,868132; 


ep(/3i) = 


0,868132 = 0,9317359 
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FIGURA 3.11 

Linha de regressao 
estimada para os 
dados salario- 
-escolaridade da 
Tabela 2.6. 
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Com base nos dados dessa tabela, obtemos a linha de regressao estimada do seguinte modo: 

% = -0,0144 + 0,7240X ( - (3.6.1) 

A Figura 3.11 apresenta geometricamente a linha de regressao estimada. 

Como sabemos, cada ponto da linha de regressao representa uma estimativa do valor medio de 
Y correspondente ao valor de X escolhido; Y t e uma estimativa de E(Y\ X,). O valor de fa — 0,7240, 
que mede a inclina§ao da linha, mostra que, dentro da faixa amostral de X entre 6 e 18 anos de 
estudo, quando X aumenta em 1 ano, o aumento estimado no salario-hora medio e de cerca 0,72. 
Para cada ano adicional de escolaridade, em media, o salario-hora aumenta em 72 centavos 
de dolar. 

O valor fa — —0,0144, que e o intercepto da linha, indica o nivel medio do salario semanal quan¬ 
do o rn'vel de escolaridade e zero. Essa interpreta§ao literal do intercepto nesse caso nao faz sentido. 
Como e possivel ter um salario negativo? Como veremos ao longo do livro, muitas vezes o intercepto 
nao apresenta um significado viavel no sentido pratico. Alem disso, o intervalo amostral nao inclui 
um nfvel de escolaridade zero. 

O valor de r 2 , em torno de 0,90, sugere que a escolaridade explica cerca de 90% da varia 5 ao 
no salario. Como r 2 pode ser no maximo igual a 1, nossa linha de regressao ajusta-se muito bem 
aos dados. O coeficiente de correlafao r — 0,9521 mostra que salario e anos de estudo tem uma 
correlagao positiva e alta. 

Antes de finalizarmos nosso exemplo, note que esse modelo e extremamente simples. A teoria 
economica do trabalho nos informa que, alem da escolaridade, variaveis como genero, ra 5 a, local, 
sindicatos trabalhistas e idiomas tambem sao fatores importantes na determina 5 ao do salario. Depois 
de estudarmos a regressao com multiplas variaveis nos Capitulos 7 e 8, passaremos a considerar um 
modelo mais extenso para a dcterminayao do salario. 
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3.7 Exemplos ilustrativos 


EXEMPLO 3.1 

Relagao entre 
consumo e renda 
nos Estados 
Unidos, 1960- 
-2005 


Voltemos aos dados de consumo e renda apresentados na Tabela 1.1 da Introdugao. Ja 
mostramos os dados na Figura 1.3, juntamente com a linha de regressao estimada da Equa- 
gao (1.3.3). Agora, apresentaremos os resultados da regressao de minimos quadrados ordina- 
rios obtidos com o pacote estatfstico Eviews 6. Nota: Y = despesas pessoais de consumo 
(DPC) e X = produto interno bruto (PIB), medidos em $ bilhoes de 2000. Neste exemplo, os 
dados formam uma serie temporal. 

n=-299,5913 + 0,7218X t ( 3 . 7 . 1 ) 

var(/1i) = 827,4195 ep^) = 28,7649 
var 0§ 2 ) = 0,0000195 ep(S 2 ) = 0,004423 
r 2 = 0,9983 & 2 = 7 3,56689 


A Equagao 3.7.1 e a fungao consumo agregado ou, para a economia como um todo, 
fungao consumo keynesiana. Como ela mostra, a propensao marginal a consumir (PMC) 
e de cerca de 0,72, sugerindo que, se a renda real aumenta em um dolar, as despesas medias 
de consumo pessoal (DCP) sobem em cerca de $ 0,72. Segundo a teoria keynesiana, a PMC 
deve situar-se entre 0 e 1. 

O valor do intercepto neste exemplo e negativo, o que nao faz sentido economico. Em 
uma interpretagao literal, isso significa que, se o valor do PIB fosse zero, o nfvel medio das 
despesas pessoais de consumo seria cerca de -$ 299 bilhoes. 

O valor de r 2 , 0,9983, significa que aproximadamente 99% da variagao nas DPC sao ex- 
plicados pela variagao do PIB. Esse valor e bastante alto, considerando que r 2 pode ser no 
maximo igual a 1. Como veremos ao longo do livro, nas regressoes que envolvem series tem- 
porais, em geral obtemos valores altos de r 2 . Veremos as razoes desse fenomeno no capitulo 
sobre autocorrelagao assim como no capitulo sobre econometria das series temporais. 


EXEMPLO 3.2 

Despesas com 
alimentagao na 
India 


Volte aos dados apresentados na Tabela 2.8 do Exercfcio 2.15. Eles referem-se a uma 
amostra de 55 domicflios rurais da India. Neste exemplo, o regressando e a despesa com 
alimentos e o regressor a despesa total, uma proxy para a renda, ambas em rupias. Neste 
caso, estamos diante de dados de corte transversal. 

Com base nos dados fornecidos, obtivemos a seguinte regressao: 


DespAlimentagao, = 94,2087 + 0,4368 DespTotal, ( 3 . 7 . 2 ) 

var (fa) = 2560,9401 ep(fa) = 50,8563 

var (fa) = 0,0061 ep(/1 2 ) = 0,0783 

r 2 = 0,3698 6 2 = 4469,691 3 

Com base na Equagao (3.7.2), vemos que, se a despesa total aumenta em 1 rupia, as des¬ 

pesas com alimentagao aumentam em media cerca de 44 paisas (1 rupia =100 paisas). Se 
as despesas totais fossem iguais a zero, a despesa media com alimentagao seria cerca de 94 
rupias. Novamente, a interpretagao mecanica do intercepto pode nao ter muito sentido. 
Neste exemplo, pode-se argumentar que mesmo que as despesas totais fossem iguais a zero 
(como no caso da perda de emprego), as pessoas ainda manteriam um mfnimo de gastos 
com alimentagao, seja pedindo dinheiro emprestado ou langando mao de economias. 

O valor de r 2 , cerca de 0,37, significa que apenas 37% da variagao nas despesas com 
alimentagao sao explicadas pela despesa total. Esse pode parecer um valor muito baixo, mas, 
como veremos ao longo do livro, quando trabalhamos com dados de corte transversal, em 
geral, obtemos valores baixos para r 2 , possivelmente em decorrencia da diversidade de uni- 
dades contidas na amostra. Trataremos deste topico no capitulo sobre heterocedasticidade 
(veja o Capitulo 11). 
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EXEMPLO 3.3 

Demanda por 
telefones 
celulares e 
computadores 
pessoais em 
relagao a renda 
pessoal per 
capita 


A Tabela 3.3 mostra os dados relativos ao numero de assinantes de operadoras de tele- 
fonia movel e o numero de computadores pessoais (PCs), ambos para cada 100 indivfduos, 
e a renda per capita ajustada pelo poder de compra em dolares para uma amostra de 34 
pafses. Neste caso, temos dados de corte transversal. Eles referem-se ao ano de 2003 e fo- 
ram obtidos por meio do Statistical Abstract of the United States, 2006. 

Embora celulares e PCs sejam extensivamente usados nos Estados Unidos, isso nao ocorre 
em muitos pafses. Para verificarmos se a renda per capita e um fator no uso de celulares e PCs, 
construfmos uma regressao para cada um desses meios de comunicafao usando como amos¬ 
tra 34 pafses. Os resultados foram os seguintes: 


TABELA 3.3 

Numero de 
assinantes de 
operadoras de 
telefonia movel e 
numero de 
computadores 
pessoais para cada 
100 indivfduos e 
renda per capita 
em 2003 para 
parses 

selecionados. 


Fonte: Statistical 
Abstract of the United 
States , 2006, Tabela 
1.364 para dados sobre 
telefones celulares e 
computadores pessoais e 
Tabela 1.327 para renda 
per capita ajustada pelo 
poder de compra. 


Pafs 

Celular 

PCs 

Renda per capita (em $) 

Argentina 

17,76 

8,2 

11410 

Australia 

71,95 

60,18 

28780 

Belgica 

79,28 

31,81 

28920 

Brasil 

26,36 

7,48 

7510 

Bulgaria 

46,64 

5,19 

75,4 

Canada 

41,9 

48,7 

30040 

China 

21,48 

2,76 

4980 

Colombia 

14,13 

4,93 

6410 

Republica Tcheca 

96,46 

17,74 

15600 

Equador 

18,92 

3,24 

3940 

Egito 

8,45 

2,91 

3940 

Franca 

69,59 

34,71 

27640 

Alemanha 

78,52 

48,47 

27610 

Grecia 

90,23 

8,17 

19900 

Guatemala 

13,15 

1,44 

4090 

Hungria 

76,88 

10,84 

13840 

India 

2,47 

0,72 

2880 

Indonesia 

8,74 

1,19 

3210 

Italia 

101,76 

23,07 

26.830 

Japao 

67,9 

38,22 

28450 

Mexico 

29,47 

8,3 

8980 

Holanda 

76,76 

46,66 

28560 

Paquistao 

1,75 

0,42 

2040 

Polonia 

45,09 

14,2 

11210 

Russia 

24,93 

8,87 

8950 

Arabia Saudita 

32,11 

13,67 

13230 

Africa do Sul 

36,36 

7,26 

10130 

Espanha 

91,61 

19,6 

22150 

Suecia 

98,05 

62,13 

26710 

Suf^a 

84,34 

70,87 

32220 

Tailandia 

39,4 

23,98 

7450 

Reino Unido 

91,17 

40,57 

27690 

Estados Unidos 

54,58 

65,98 

37750 

Venezuela 

27,3 

6,09 

4750 


Nota: Os dados sobre celulares e PCs sao para cada 100 indivfduos. 


Demanda por telefones celulares. Sendo Y = numero de assinantes de operadoras de 
telefonia movel e X = renda per capita ajustada pelo poder de compra, obtivemos a seguinte 
regressao: 


Yj = 1 4,4773 + 0,0022X, (3.7.3) 

epCSO = 6,1523; ep(fo) = 0,00032 
r 2 = 0,6023 


( Continua ) 
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EXEMPLO 3.3 

(Continuagdo) 


O coeficiente angular sugere que, se a renda per capita aumentar em media $ 1.000, o 
numero de assinantes de operadoras de telefonia movel aumentara em 2,2 para cada 100 
indivfduos. O valor do intercepto de cerca de 14,47 sugere que, mesmo que a renda per 
capita seja zero, o numero medio de assinantes sera de 14 para cada 100 indivfduos. Nova- 
mente, essa interpretagao pode nao ter muito sentido, pois em nossa amostra nao existe 
nenhum pafs com renda per capita zero. O valor de r 2 e moderadamente alto. Mas note que 
nossa amostra inclui uma variedade de pafses com diversos nfveis de renda. Em uma amostra 
tao diversificada como esta, nao poderfamos esperar um valor de r 2 muito elevado. 

Apos estudarmos o Capftulo 5, mostraremos como os erros padrao apresentados na 
Equag:ao (3.7.3) podem ser usados para avaliar a significance estatfstica dos coeficientes es- 
timados. 


Demanda por computadores pessoais. Embora os prepos dos computadores pessoais 
tenham cafdo substancialmente ao longo dos anos, os PCs ainda nao sao onipresentes. Um 
determinante importante da demanda por PCs e a renda pessoal. Outro determinante e o 
prefo, mas nao temos dados comparativos sobre pre^o de PCs para os pafses de nossa amos¬ 
tra. Sendo Y o numero de PCs e X a renda per capita, obtivemos a seguinte demanda "par- 
cial" por PCs (parcial porque nao temos dados comparativos sobre prepos ou sobre outras 
variaveis que podem afetar a demanda por PCs): 

Y, = -6,5833 + 0,0018X, (3.7.4) 

ep(/h) = 2,7437; ep(/S 2 ) = 0,00014 

r 2 = 0,8290 

Como esses resultados sugerem, a renda pessoal per capita tern uma rela^ao positiva com a 
demanda por PCs. Depois de estudarmos o Capftulo 5, voce vera que, estatisticamente, a renda 
pessoal per capita e um determinante importante da demanda por PCs. O valor negativo do 
intercepto neste caso nao tern significado pratico. A despeito da diversidade de nossa amostra, 
o i 2 estimado e bastante alto. A interpreta^ao do coeficiente angular e que, se a renda per capi¬ 
ta aumentar em media $ 1.000, a demanda por computadores pessoais aumentara cerca de 2 
unidades para cada 100 indivfduos. 

Embora o uso de PCs esteja popularizando-se rapidamente, ha muitos pafses que ainda 
usam computadores mainframe. Portanto, o uso total de computadores nesses pafses pode 
ser muito maior do que aquele indicado pela venda de PCs. 


3.8 Uma nota sobre os experimentos de Monte Carlo 

Neste capftulo, mostramos que, sob as hipoteses do modelo classico de regressao linear, os estima- 
dores de mfnimos quadrados apresentam certas caracterfsticas desejaveis resumidas na propriedade de 
melhor estimador linear nao viesado (MELNT). No Apendice deste capftulo, demonstraremos essa 
propriedade de modo mais formal. Entretanto, como e possfvel saber na pratica que a propriedade de 
melhor estimador linear nao viesado se sustenta? Por exemplo, como verificamos se os estimadores 
de MQO sao nao viesados? A resposta e dada pelos chamados experimentos de Monte Carlo, que sao 
em essencia simula 5 oes de computador ou experimentos de amostragem. 

Para apresentar as ideias basicas, considere nossa fun 5 ao de regressao populacional (FRP) com 
duas variaveis: 


Yi — Pi + Pi Xi + Uj (3.8.1) 

Um experimento de Monte Carlos segue os seguintes passos: 

1. Suponha que os verdadeiros valores dos parametros sejam =20 e f} 2 — 0.6. 

2. Escolha o tamanho da amostra como, por exemplo, n = 25. 

3. Fixe os valores de X para cada observa 5 ao. Ao todo, serao 25 valores de X. 
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4. Suponha que voce usou uma tabela de numeros aleatorios para escolher 25 valores e os chamou 
de Uj (atualmente, a maioria dos pacotes estatfsticos j a inclui geradores de numeros aleatorios). 24 

5. Como voce conliece Pi, /3 2 , X, e m„ aplicando a Equa^ao (3.8.1) obtemos 25 valores de Y r 

6. Agora, com os 25 valores de Y t gcrados desse modo, fazemos a regressao deles contra os va¬ 
lores de X escolhidos no passo 3, obtendo p x e /L, os estimadores de minimos quadrados. 

7. Suponha que o experimento seja repetido 99 vezes, usando, sempre, os mesmos valores de p u 
yS 2 e X. Obviamente, os valores de m, variarao de experimento para experimento. Portanto, ao 
todo temos 100 experimentos, gerando, assim, cem valores de /d, e /L (na pratica, sao condu- 
zidos muitos desses experimentos, as vezes de 1.000 a 2.000.) 

8. Chame as medias daquelas cem estimativas de Pi e p 2 . 

9. Se os valores estiverem muito proximos dos verdadeiros valores de f> x e p 2 definidos no passo 1, 
este experimento Monte Carlo “estabelece” que os estimadores de minimos quadrados sao, de 
fato, nao viesados. Lembre-se de que, segundo o modelo classico de regressao linear, E(ft ,) = ( J >\ 
e E0 2 ) = fi 2 . 

Esses passos caracterizam a natureza geral dos experimentos de Monte Carlo, que sao muitas 
vezes utilizados para estudar as propriedades estatfsticas de varios metodos de estima 5 ao de parametros 
populacionais. Eles sao especialmente uteis para estudar o comportamento dos estimadores em 
amostras pequenas ou finitas. Tambem sao um excelente meio de destacar o conceito de amostras 
repetidas, que e a base da maior parte da inferencia estatfstica classica, como veremos no Capftulo 5. 
Apresentaremos varios exemplos de experimentos de Monte Carlo por meio de exercfcios para sala de 
aula. (Veja o Exercicio 3.27.) 


Resumo e 
conclusoes 


Os topicos e conceitos mais importantes deste capitulo podem ser resumidos da seguinte forma: 

1 . A estrutura basica da analise de regressao e o modelo classico de regressao linear (MCRL). 

2. O MCRL baseia-se em um conjunto de hipoteses. 

3. Com base nessas hipoteses, os estimadores de minimos quadrados assumem determinadas pro¬ 
priedades resumidas no teorema de Gauss-Markov, que informa que, na classe dos estimadores 
lineares nao viesados, os estimadores de minimos quadrados tem variancia minima. Em resumo, 
eles sao o melhor estimador linear nao viesado (MELNT ou BLUE). 

4. A precisao dos estimadores de MQO e medida por seus erros padrao. Nos Capftulos 4 e 5, veremos 
como eles nos permitem fazer inferences sobre os parametros populacionais: os coeficientes p. 

5. A qualidade geral do ajustamento do modelo de regressao e medida pelo coeficiente de determi- 
nacao: r * 1 2 3 4 5 6 7 . Ele nos indica que propor§ao da varia§ao da variavel dependente, ou regressando, e 
explicada pela variavel explanatoria, ou regressor. O valor de r 2 situa-se entre 0 e 1; quanto mais 
proximo de 1, melhor o ajustamento. 

6. Um conceito relacionado ao coeficiente de determinaijao e o coeficiente de correla?ao: r. E uma 
medida de associagao linear entre duas variaveis, e seu valor situa-se entre -1 e +1. 

7. O modelo classico de regressao linear e um construto teorico ou uma abstra?ao, porque se apoia 
em um conjunto de hipoteses que pode ser rigido ou “pouco realista”. Mas esse tipo de abstra?ao 
e muitas vezes necessario nos estagios iniciais do estudo em qualquer area do conhecimento. Uma 
vez dominado o MCRL, podemos verificar o que acontece se uma ou mais das hipoteses nao 
forem satisfeitas. A primeira parte deste livro e dedicada ao estudo do modelo classico de re¬ 
gressao linear. As demais partes consideram refinamentos do MCRL. A Tabela 3.4 apresenta um 
roteiro do que vira mais adiante. 


24 Na pratica, supoe-se que u, siga uma certa distribuifao de probabilidade normal, com certos parametros (como, 
media e variancia). Uma vez especificados os valores dos parametros, e facil gerar os u , com o auxflio dos paco¬ 
tes estatfsticos. 
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TABELA 3.4 

O que acontece se 
as hipoteses do 
MCRL nao forem 
respeitadas? 


EXERCICIOS 


Numero 
da hipotese 

Tipo de desrespeito 

Onde estudar? 

1 

Nao linearidade nos parametros 

Capftulo 14 

2 

Regressor(es) estocastico(s) 

Capftulo 1 3 

3 

Media de w, diferente de zero 

Introdugao a Parte II 

4 

Heterocedasticidade 

Capftulo 11 

5 

Termos de erros autocorrelacionados 

Capftulo 12 

6 

Termos de observagao amostrais 

Capfulo 10 

7 

inferiores ao numero de regressores 
Variabilidade insuficiente nos regressores 

Capftulo 10 

8 

Multicolinearidade* 

Capftulo 10 

9 

Vies de especificagao* 

Capftulos 1 3, 14 

1 0** 

Termos de erro nao normais 

Capftulo 1 3 


*Essas hipoteses serao apresentadas no Capftulo 7, quando discutiremos o modelo de regressao multipla. 

**Notas: a hipotese de que os termos Uj sao normalmente distribufdos nao faz parte do MCRl. Falaremos mais disto no Capftulo 4. 


3.1. Dadas as hipoteses da coluna 1 da tabela a seguir, demonstre que as premissas apresentadas na 
coluna 2 sao suas equivalentes. 


Hipoteses do modelo classico 


0) 

(2) 

E( Ui |X,) = 0 

f(V) IV) = 02 + fh. V- 

cov {u„Uj) = 0 (/* j) 

cov (Yi,Yj) = 0 /Vy 

var (u,- |X,) = a 2 

var (Y, |X,) = a 2 


3.2. Mostre que as estimativas = 1,572 e — 1.357 usadas no primeiro experimento da Tabela 
3.1 sao, de fato, calculadas pelos estimadores de MQO. 

3.3. De acordo com Malinvaud (veja a nota de rodape 11), a hipotese de que £(m, IX,-) = 0 e bastan- 

te importante. Para tanto, considere a FRP: Y — + /3 2 X,- + m,. Agora, considere duas situa- 

goes: (i) — 0, = 1 e £(«,-) = 0; e (ii) = 1, f} 2 — 0 e £(«,-) = (X,- - l).Tome a esperanga da 

FRP condicional a X nos dois casos anteriores e veja se concorda com Malinvaud a respeito do 
significado da hipotese E(Uj IX,-) = 0. 

3.4. Considere a regressao amostral 

Yi = f)\ + Pi X,- + M, 

Impondo as restrigoes (i) ^m ( - = 0e (ii) ^m,-X ( - = 0, obtenha os estimadores fte^e mostre 
que eles sao identicos aos estimadores de mlnimos quadrados dados nas Equagoes (3.1.6) e 
(3.1.7). Esse metodo de obter estimadores e conhecido como princfpio da analogia. Apresen- 
te uma justificativa intuitiva para a imposigao das restrigoes (i) e (ii). ( Dica: lembre-se da 
premissa de MCRL sobre «,-.) Note que o princfpio da analogia para estimar parametros desco- 
nhecidos tambem e denominado metodo dos momentos, em que momentos amostrais (por 
exemplo, medias amostrais) sao usados para estimar os momentos populacionais (como a me¬ 
dia populacional). Como observado no Apendice A, um momento e uma estatfstica sintetica 
de uma distribuigao de probabilidade, tal como o valor esperado e a variancia. 

3.5. Mostre que r definido em (3.5.5) situa-sc entre 0 e 1. Voce pode aplicar a desigualdade de Cauchy- 
-Schwartz, segundo a qual, para quaisquer variaveis aleatorias X e Y, a seguinte relagao e valida: 


[£(XT)1 2 < E(X 2 )E(Y 2 ) 
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3.6. j3 yx e fi,-y representam os coeficientes angulares nas regressoes de Y contra X e de X contra Y, 
respectivamente. Mostre que: 

PyxPxy = r 2 

em que reo coeficiente de correlapao entre X e Y. 

3.7. Suponha que, no exercfcio anterior, p r/ = 1. Teria alguma importancia se fizessemos a re¬ 
gressao de Y contra X ou de X contra Y? Explique cuidadosamente. 

3.8. O coeficiente de correlapao de rankings (classificapao) de Spearman, r v e definido assim: 

, 6 £d 2 

r s = 1 - -r -2 -77 

n(n A — 1) 

em que d — diferenpa nos rankings atriburdos ao mesmo indivrduo ou fenomeno e n — nume- 
ro de indivfduos ou fenomenos ranqueados. Deduza r s por meio de r definido na Equapao 
(3.5.13). Dica: ordene os valores de X e de Y de 1 a n. Observe que a soma dos rankings de X 
e de Y e n(n + l)/2, para cada um, e, portanto, suas medias sao (n + l)/2. 

3.9. Considere a seguinte formulapao da FRP de duas variaveis: 

Modelo I: Y t = ft + fi 2 X, + Ui 
Modelo II: Y, = aq + a 2 (Xi — X) + m, 

a. Calcule os estimadores de e oq. Sao identicos? Suas variancias sao identicas? 

b. Calcule os estimadores de /J 2 e a 2 . Sao identicos? Suas variancias sao identicas? 

c. Qual a vantagem, se e que existe, do modelo II em relapao ao modelo I? 

3.10. Suponha que voce execute a seguinte regressao: 

Y; — Pi + PiXi + t<; 

em que, como de costume, y t e x, sao desvios em relapao as respectivas medias. Qual sera o valor 
de /l[? Por que? fi 2 sera igual ao obtido por meio da Equapao (3.1.6)? Por que? 

3.11. Seja r x = coeficiente de correlapao entre n pares de valores (Y n X x ) e r 2 = coeficiente de corre- 
lapao entre n pares de valores iaX-, + b, cYj + d), em que a,b,ced sao constantes. Mostre que 
r x — r 2 e estabeleqa, assim, o principio de que o coeficiente de correlaqao ndo varia em rela- 
gao a mudanga de escala e a mudanga de origem. 

Dica: aplique a definipao de r dada na Equapao (3.5.13). 

Nota: as operapoes aX h X t + b e aX t + b sao conhecidas, respectivamente, como mudanga de 
escala, mudanga de origem e mudanga de escala e de origem. 

3.12. Se r, o coeficiente de correlapao entre n pares de valores (X„ Y,), for positivo, determine se cada 
uma das seguintes afirmapoes e verdadeira ou falsa: 

a. r entre (—X h — YJ) tambem e positivo. 

b. r entre (— X h Y,) e entre (X„ — Y t ) pode ser positivo ou negativo. 

c. Os coeficientes angulares ji yx ^ sao positivos, em que fi yl = coeficiente angular na regres¬ 
sao de Y contra X e /iQ. = coeficiente angular da regressao de X contra Y. 

3.13. Se X x , X 2 e X 2 sao variaveis nao correlacionadas tendo, cada uma delas, o mesmo desvio pa- 

drao, mostre que o coeficiente de correlapao entre X t +X 2 e X 2 + X 2 e igual a ^ . Por que o 
coeficiente de correlapao nao e igual a zero? 

3.14. Na regressao Y t = + fi 2 X t + u h suponha que multipliquemos cada valor de X por uma cons- 

tante 2. Isso alterara os residuos e os valores ajustados de Y? Explique. O que aconteceria se 
somassemos um valor constante 2 a cada valor de XI 



108 


Parte Um Modelos de regressao com equagao unica 


3.15. Mostre que a Equagao (3.5.14) mede, de fato, o coeficiente de determinagao. Dica: aplique a 

definigao de r dad a na Equagao (3.5.13) e lembre-se de que v, y, + u,)}: — yf, 

bem como da Equagao (3.5.6). 

3.16. Explique, justificando, se as seguintes afirmagoes sao verdadeiras, falsas ou duvidosas: 

a. Como a ccrrelagao entre duas variaveis, X e Y, pode variar entre —1 e +1, isso significa que 
cov ( X , Y) tambem se situa entre esses limites. 

b. Se a correlagao entre duas variaveis for zero, isso quer dizer que nao ha qualquer relagao 
entre as duas variaveis. 

c. Se fizermos uma regressao de Y, contra Yy (isto e, Y observado contra Y estimado), os va- 
lores do intercepto e do coeficiente angular serao 0 e 1, respectivamente. 

3.17. Regressao sem qualquer regressor: imagine o modelo Y t — /3j + u t . Aplique os mrnimos qua- 
drados ordinarios para encontrar o estimador de (i { . Qual a variancia e a SQR da regressao? O 
ySi estimado tem qualquer sentido intuitivo? Agora, pense no modelo de duas variaveis 1) = /d | 
+ Pi X, + u r Vale a pena acrescentar X, ao modelo? Em caso negativo, por que se preocupar 
com a analise de regressao? 

Exercfcios aplicados 

3.18. Na Tabela 3.5 esta a classificatjao de dez estudantes nas provas parcial e final de estatistica. 
Calcule o coeficiente de correlacjao de rankings de Spearman e interprete os resultados. 


TABELA 3.5 


Ranking A B 

Prova parcial 1 3 

Prova Final 3 2 


Estudante 
C D E F 

7 10 9 5 

8 7 9 6 


G 

4 

5 


H I J 

8 2 6 

10 1 4 


3.19. A relacao entre a taxa de cambio nominal e ospregos relativos. Com base nas observa 5 oes anuais 
de 1985 a 2005, obteve-se a seguinte regressao, em que Y — taxa de cambio do dolar canadense 
em relac^ao ao dolar americano (DC/$) e X — razao do IPC americano pelo IPC canadense, isto 
e, X representa os pregos relativos dos dois pafses: 

Y, = 0,912 + 2,250V, r 2 = 0,440 
ep = 0,096 

a. Interprete a regressao. Como voce interpretaria r 2 ? 

b. O valor positivo de X, faz sentido economico? Qual a teoria economica em que se embasa? 

c. Suponha que X seja redefinido como a razao entre o IPC canadense e o IPC americano. Isso 
mudaria o sinal de X? Por que? 

3.20. A Tabela 3.6 apresenta dados relativos a Indices de produgao por hora (V) e remuneragao real 
por hora (Y) para os setores empresarial e empresarial nao agricola da economia dos Estados 
Unidos no periodo 1960-2005. O ano-base dos indices e 1992 = 100 e os Indices foram ajus- 
tados sazonalmente. 

a. Represente graficamente Y contra X para os dois setores da economia separadamente. 

b. Qual a teoria economica que embasa a relagao entre as duas variaveis? O grafico de disper- 
sao confirma a teoria? 

c. Estime uma regressao de MQO de Y contra X. Guarde os resultados para examina-los no- 
vamente depois de estudar o Capltulo 5. 
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TABELA 3.6 


Produ^ao por hora de 

Remunerafao real 

Produtividade e dados 


todas as 

pessoas 1 

por 

Hora 2 - 3 

relacionados, setor 



Setor 


Setor 

empresarial 1960- 


Setor 

empresarial 

Setor 

empresarial 

-2005 (numeros- 
mdice, 1992 = 100; 

Ano 

empresarial 

nao agricola 

empresarial 

nao agricola 

dados trimestrais 

1960 

48,9 

51,9 

60,8 

63,3 

sazonalmente 

1961 

50,6 

53,5 

62,5 

64,8 

ajustados) 

1962 

52,9 

55,9 

64,6 

66,7 


1963 

55,0 

57,8 

66,1 

68,1 

Fonte. EdonotniL * I \ ej ) t)11 aj ' 
the President , 2007, 

1964 

56,8 

59,6 

67,7 

69,3 

Tabela 49. 

1965 

58,8 

61,4 

69,1 

70,5 


1966 

61,2 

63,6 

71,7 

72,6 

1967 

62,5 

64,7 

73,5 

74,5 

1968 

64,7 

66,9 

76,2 

77,1 

1969 

65,0 

67,0 

77,3 

78,1 

1970 

66,3 

68,0 

78,8 

79,2 

1971 

69,0 

70,7 

80,2 

80,7 

1972 

71,2 

73,1 

82,6 

83,2 

1973 

73,4 

75,3 

84,3 

84,7 

1974 

72,3 

74,2 

83,3 

83,8 

1975 

74,8 

76,2 

84,1 

84,5 

1976 

77,1 

78,7 

86,4 

86,6 

1977 

78,5 

80,0 

87,6 

88,0 

1978 

79,3 

81,0 

89,1 

89,6 

1979 

79,3 

80,7 

89,3 

89,7 

1980 

79,2 

80,6 

89,1 

89,6 

1981 

80,8 

81,7 

89,3 

89,8 

1982 

80,1 

80,8 

90,4 

90,8 

1983 

83,0 

84,5 

90,3 

90,9 

1984 

85,2 

86,1 

90,7 

91,1 

1985 

87,1 

87,5 

92,0 

92,2 

1986 

89,7 

90,2 

94,9 

95,2 

1987 

90,1 

90,6 

95,2 

95,5 

1988 

91,5 

92,1 

96,5 

96,7 

1989 

92,4 

92,8 

95,0 

95,1 

1990 

94,4 

94,5 

96,2 

96,1 

1991 

95,9 

96,1 

97,4 

97,4 

1992 

100,0 

100,0 

100,0 

100,0 

1993 

100,4 

100,4 

99,7 

99,5 

1994 

101,3 

101,5 

99,0 

99,1 

1995 

101,5 

102,0 

98,7 

98,8 

1996 

104,5 

104,7 

99,4 

99,4 

1997 

106,5 

106,4 

100,5 

100,3 

1998 

109,5 

109,4 

105,2 

104,9 

1999 

112,8 

112,5 

108,0 

107,5 

2000 

116,1 

115,7 

112,0 

111,5 

2001 

119,1 

118,6 

113,5 

112,8 

2002 

124,0 

123,5 

115,7 

115,1 

2003 

128,7 

128,0 

117,7 

117,1 

2004 

132,7 

131,8 

119,0 

118,2 

2005 

135,7 

134,9 

120,2 

119,3 


1 A produfao se refere ao PIB real do setor. 

“Salarios e ordenados dos empregados mais contribu^ao dos empregadores a seguridade social e aos pianos de aposentadoria privados. 
3 Remunera 9 ao por hora dividida pelo IPC para todos os consumidores urbanos nos trimestres recentes. 
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3.21. Os seguintes resultados foram obtidos com base em uma amostra de 10 observances: 

y, = l.no J2 X > = 1 - 700 J2 XiY < = 205 - 500 

J2 X i = 322.000 = 13 2. 10 ' o 

com coeficiente de correlanao r — 0,9758. Mas, ao conferir esses dados, verificou-se que dois 
pares de observances tinham sido registrados como: 


Y 

X 

Y 

X 

90 

120 

. 80 
em vez de _ „ 
150 

110 

140 

220 

210 


Qual sera o efeito desse erro sobre rl Calcule o r correto. 

3.22. A Tabela 3.7 apresenta dados relativos a prenos do ouro, indice de prenos ao consumidor (IPC) 
e o mdice NYSE da Bolsa de Valores de Nova York para o periodo 1974-2006. O indice NYSE 
inclui mais de 1.500 agoes negociadas nessa bolsa. 

a. Assinale, em um mesmo diagrama de dispersao, os prenos do ouro, o IPC e o indice 
NYSE. 


TABELA 3.7 

Ano 

Prego do Ouro 

Indice NYSE 

IPC 

Prego do ouro, mdice 
Nyse e IPC para os 
Estados Unidos no 

1974 

159,2600 

463,5400 

49,30000 

1975 

161,0200 

483,5500 

53,80000 

periodo 1974-2006 

1976 

124,8400 

575,8500 

56,90000 

1977 

157,7100 

567,6600 

60,60000 


1978 

193,2200 

567,8100 

65,20000 

1979 

306,6800 

616,6800 

72,60000 

1980 

612,5600 

720,1500 

82,40000 

1981 

460,0300 

782,6200 

90,90000 

1982 

375,6700 

728,8400 

96,50000 

1983 

424,3500 

979,5200 

99,60000 

1984 

360,4800 

977,3300 

103,9000 

1985 

317,2600 

1142,970 

107,6000 

1986 

367,6600 

1438,020 

109,6000 

1987 

446,4600 

1709,790 

11 3,6000 

1988 

436,9400 

1585,140 

118,3000 

1989 

381,4400 

1903,360 

124,0000 

1990 

383,5100 

1939,470 

130,7000 

1991 

362,1100 

2181,720 

1 36,2000 

1992 

343,8200 

2421,510 

140,3000 

1993 

359,7700 

2638,960 

144,5000 

1994 

384,0000 

2687,020 

148,2000 

1995 

384,1700 

3078,560 

152,4000 

1996 

387,7700 

3787,200 

156,9000 

1997 

331,0200 

4827,350 

160,5000 

1998 

294,2400 

5818,260 

163,0000 

1999 

278,8800 

6546,810 

166,6000 

2000 

279,1100 

6805,890 

172,2000 

2001 

274,0400 

6397,850 

177,1000 

2002 

309,7300 

5578,890 

1 79,9000 

2003 

363,3800 

5447,460 

184,0000 

2004 

409,7200 

6612,620 

188,9000 

2005 

444,7400 

7349,000 

195,3000 

2006 

603,4600 

8357,990 

201,6000 
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b. Supoe-se que um investimento funcione como protec^ao contra a inflac^ao se seu pre^o e/ou 
sua taxa de retorno acompanha, pelo menos, a taxa de inflac^ao. Para testar essa hipotese, 
ajuste o seguinte modelo, supondo que o diagrama de dispersao elaborado no item (a) su- 
giria que isso seja adequado: 

Pre£o do ouro, — P\ + Pi 1 PC, + u. 

Indice NYSE, = p x + p 2 IPC, + u, 

3.23. A Tabela 3.8 apresenta dados do produto interno bruto (PIB) dos Estados Unidos no periodo 
1959-2005. 

a. Represente graficamente os dados do PIB em dolares correntes e em dolares constantes (de 
2000) em relac;ao ao tempo. 

b. Denotando o PIB por Keo tempo por X (medido em uma sequencia cronologica em que 1 
represente 1959, 2, 1960 e assim por diante ate 47 para 2005), veja se o seguinte modelo 
ajusta-se aos dados do PIB: 


— P\ + Pi X, + u, 

Estime este modelo para o PIB nominal e para o PIB real. 

c. Como voce interpretaria P{! 

d. Se existe diferen£a entre o p 2 estimado para o PIB nominal e para o fi 2 estimado para o PIB 
real, o que explica essa diferen^a? 

e. Com base nos resultados obtidos, o que se pode dizer sobre a natureza da inflac^ao america- 
na durante o periodo da amostra? 


TABELA 3.8 

PIB nominal e real, 
1959-2005 (em 
bilhoes de dolares, 
exceto se notificado; 
dados anuais 
sazonalmente 
ajustados com base 
em valores 
trimestrais; PIB real 
em bilhoes de dolares 
encadeados de 2000.) 


Ano 

PIB nominal 

PIB real 

1959 

506,6 

2.441,3 

1960 

526,4 

2.501,8 

1961 

544,7 

2.560,0 

1962 

585,6 

2.715,2 

1963 

617,7 

2.834,0 

1964 

663,6 

2.998,6 

1965 

719,1 

3.191,1 

1966 

787,8 

3.399,1 

1967 

832,6 

3.484,6 

1968 

910,0 

3.652,7 

1969 

984,6 

3.765,4 

1970 

1.038,5 

3.771,9 

1971 

1.127,1 

3.898,6 

1972 

1.238,3 

4.105,0 

1973 

1.382,7 

4.341,5 

1974 

1.500,0 

4.319,6 

1975 

1.638,3 

4.311,2 

1976 

1.825,3 

4.540,9 

1977 

2.030,9 

4.750,5 

1978 

2.294,7 

5.015,0 

1979 

2.563,3 

5.173,4 

1980 

2.789,5 

5.161,7 

1981 

3.128,4 

5.291,7 

1982 

3.255,0 

5.189,3 


Ano 

PIB nominal 

PIB real 

1983 

3.536,7 

5.423,8 

1984 

3.933,2 

5.813,6 

1985 

4.220,3 

6.053,7 

1986 

4.462,8 

6.263,6 

1987 

4.739,5 

6.475,1 

1988 

5.103,8 

6.742,7 

1989 

5.484,4 

6.981,4 

1990 

5.803,1 

7.112,5 

1991 

5.995,9 

7.100,5 

1992 

6.337,7 

7.336,6 

1993 

6.657,4 

7.532,7 

1994 

7.072,2 

7.835,5 

1995 

7.397,7 

8.031,7 

1996 

7.816,9 

8.328,9 

1997 

8.304,3 

8.703,5 

1998 

8.747,0 

9.066,9 

1999 

9.268,4 

9.470,3 

2000 

9.817,0 

9.817,0 

2001 

10.128,0 

9.890,7 

2002 

10.469,6 

10.048,8 

2003 

10.960,8 

10.301,0 

2004 

11.712,5 

10.703,5 

2005 

12.455,8 

11.048,6 


Fonte: Economic Report of the President, 2007. Tabelas B-l e B-2. 
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3.24. Utilizando os dados da Tabela 1.1, verifique a Equagao (3.7.1). 

3.25. Com base no exemplo do SAT fornecido no Exercfcio 2.16, flu;a o seguinte: 

a. Represente graficamente a relagao entre as notas de homens e mulheres nas provas de 
aptidao verbal. 

b. Se o diagrama de dispersao sugerir que uma relagao linear entre as duas variaveis e 
apropriada, calcule a regressao da aptidao verbal das mulheres contra a dos homens. 

c. Se houver uma relagao entre as duas variaveis acima, ela e causal? 

3.26. Repita o exercfcio anterior para as notas de aptidao matematica. 

3.27. Estudo de Monte Carlo para sala de aula: consulte os 10 valores de X apresentados na 
Tabela 3.2. Seja = 25 e /S 2 — 0,5. Suponha que m, N( 0, 9), isto e, u h esta distribufdo 
normalmente com media 0 e variancia 9. Gere 100 amostras usando esses valores a fim de 
obter 100 estimativas de e /3 2 . Represente graficamente as estimativas. Que conclusoes 
voce pode tirar do estudo de Monte Carlo? Nota: a maioria dos pacotes estatfsticos permi- 
te gerar variaveis aleatorias por meio de distribuigoes de probabilidade conhecidas. Pega 
ajuda a seu professor caso tenha dificuldade em gerar tais variaveis. 

3.28. Usando os dados da Tabela 3.3, represente graficamente o numero de assinantes de operadoras 
de telefonia movel contra o numero de computadores pessoais em uso. Ha alguma relagao 
discernlvel entre os dois? Se existe, como voce justifica essa relagao? 



3A.1 Deriva^ao dos estimadores de rmnimos quadrados 


Derivando parcialmente a Equagao (3.1.2) em relagao a yS x e f} 2 , obtemos: 



( 1 ) 



( 2 ) 


Igualando essas equagdes a zero, depois de simplificagao e manipulagao algebricas, obtemos os estimado¬ 
res dados pelas Equagoes (3.1.6) e (3.1.7). 


3A.2 Propriedades de linearidade e nao tendenciosidade 
dos estimadores de rmnimos quadrados 


Com base em (3.1.8), temos: 



(3) 


em que: 



que mostra que e um estimador linear porque e fungao linear de Y; na verdade, e uma media ponderada de 
Yj, em que os k t sao os pesos. Tambem pode ser demonstrado que /L e um estimador linear. 
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As propriedades dos pesos kj sao as seguintes: 

1. Como os Xj sao considerados nao estocasticos, os kj tambem sao nao estocasticos. 

2 . = 0 . 

3. = 

4. k t x, = J^kjXj = 1. Essas propriedades decorrem diretamente da definigao de k t . 

Por exemplo, 

uma vez que, para uma dada amostra, Yj xj e conhecida 

ja que Xj, a soma dos desvios em relagao a media, 
e sempre zero. 

Agora substitua a FRP Y t = P\ + p 2 X t + u h na Equagao (3) para obter 
fa = kj(fa + fa Xj + Ut) 

= Pi kj + fa kjXj + kjUj ( 4 ) 

= Pi + y^kjUj 

em que se usam as propriedades de kj mencionadas anteriormente. 

Agora, tomando a esperanga da Equagao (4) dos dois lados da equagao e observando que os sendo nao 
estocasticos, podem ser tratados como constantes, obtemos: 




Xj 






= 0, 


E(fa) = P 2 + YkiE(Uj) 

= fa (5) 

Ja que E(uj) = 0 por hipotese. Portanto, fa ® um estimador nao viesado de P 2 . Do mesmo modo, e possfvel 
provar que fa tambem e um estimador nao viesado de p h 

3A.3 Variancias e erros padrao dos estimadores de 
rmnimos quadrados 


Agora, segundo a definigao de variancia, podemos escrever 


var (ft) = E[p 2 - E(p 2 )f 
= E(fa - P 2) 2 


= E 


(Y kiUi ) 


uma vez que E(p 2 ) = p 2 
usando a Equagao (4) acima 


— E^kju 2 + k 2 u 2 + ■ ■ • + kjuj 4 - 2k\k 2 Ujit2 + ■ ■ • 4 - 2k n —\k n u n —iu n \ 
Da hipotese E(Uj 2 ) = t? para cada i e E(Uj,u <) = 0, i ± j, segue-se que 
var (fa) = a 1 

a 2 , 

= ——2 (usando a definigao de kj) 

x i 

= Equagao (3.3.1) 


( 6 ) 


(7) 


A variancia de fa pode ser obtida seguindo a mesma linha de racioctnio ja apresentada. Uma vez obtidas as 
variancias de Pi e fa, suas raizes quadradas positivas proporcionam os erros padrao correspondentes. 
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3A.4 Covariancia entre fa e fa 

Por defini 9 §o, 

cov(4,, = em - ECPxWh - ECm\ 

= ECPi-h)Cfo~h) (Porque?) 

= -XE(p 2 -p 2 ) 2 (8) 

= — X var(/J 2 ) 

= Equagao (3.3.9) 

em que usamos o fato de que p x = Y — p 2 X e E(p{) = Y — f) 2 X, o que resulta em ySj — E(p i) = —X ( p 2 — /S 2 ). 
Nota: var (/3 2 ) e dada na Equa^ao (3.3.1). 


3A.5 Estimador de rmnimos quadrados de a 2 


Lembre-se de que: 


Portanto, 


Yi — P l + Pi Xi + u i 


Y — + fiiX 4- u 

Subtraindo (10) de (9), obtemos: 


(9) 


( 10 ) 


Yi = P 2 Xi + («,• - u) ( 11 ) 

Lembre-se tambem de que: 

Ui = yi~P 2 Xi (12) 

Portanto, substituindo a Equagao (11) na Equagao (12), obtemos: 

Ui = p 2 xj +(«,--«)- P 2 Xj (i 3) 

Reunindo os termos, elevando ao quadrado e somando os dois lados, obtemos 

£«? = (Pi - Pi) 2 J2 x - + E ( '" - t7)2 - 2( ^ - pi)J2 x ^ Ui - u) (14) 

Considerando a esperan^a dos dois lados, temos 

e (x)«?) =J2d E ^ 2 - ' 02)2 + E [5Z(“<- - “) 2 ] - 2E [(fa - Pi)J2 x ‘( ui - «>] 

= y ''xf var (j6 2 ) + (n — 1) var («,■) — 2 E /c,«,(jtii<,)j 

= a 2 + (n — 1) a 2 — 2£ ktXiU 2 j (15) 

= a 2 + (n — 1) a 2 — 2 a 2 
= (n- 2)a 2 

em que, no penultimo passo, fazemos uso da defini 9 ao de kj, dada na Equa 9 ao (3) e da rela 9 ao dada na Equa 9 ao 
(4). Note tambem que 
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E — u) 2 = E |^^\r 2 — nu 2 j 


= E 


= E 




X>i 


I>? 


= nff — —cr = (n — 1)<7 
n 

que se embasa no fato de os u ( serem nao correlacionados e de que a variancia de cada m, e cr. 
Assim, obtemos 


E = (n- 2)a 2 


Portanto, se defininnos 


«t 2 =M 

n — 2 

seu valor esperado e 

E(a 2 ) = — l —E (£ u 2 ) = ff 2 usando a Equa ? ao (16) 
o que mostra que a 2 e um estimador nao viesado do verdadeiro a 2 . 


(16) 


(17) 


(18) 


3A.6 Propriedade da variancia minima dos estimadores de 
rmnimos quadrados 

Mostramos na Se^ao 3A.2 do Apendice 3A que o estimador de mmirnos quadrados p 2 e linear e nao 
viesado (o que tambem se aplica a p{). Para mostrar que esses estimadores tambem apresentam variancia 
minima dentro da classe de todos os estimadores lineares nao viesados, considere o estimador de mmirnos 
quadrados p 2 : 


h = J2 kiYi 


Onde 


ki = 


Xi - X 


(veja Apendice 3A.2) 


m - x ) 2 e *, 2 

que mostra que p 2 e uma media ponderada de todos os Y, com peso k ( . 
Vamos definir um estimador linear alternative de P 2 do seguinte modo: 

PI =Y, WiY ‘ 

onde Wj, tambem sao pesos, nao necessariamente iguais a k t . Agora, 

E(P |) = 

= + PiXi) 

= Pi Wj + p 2 WiXj 
Portanto, para que p* seja nao viesado, e preciso que 

!>■■ = ° 


(19) 


( 20 ) 


( 21 ) 


(22) 
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e 


J2 w ‘ x ‘ = 1 


( 23 ) 


Tambem podemos escrever 


var (f$ 2 ) = var ^ w, Yj 

= w 2 var Yj ( Nota: war Yj = var Uj = o 2 ) 

= a 2 ^2 {Nota: cow (Yj, Yj) — 0 (i ^ j)) 




( 24 ) 


porque o ultimo ternio desaparece no penultimo passo. (Por que?) 

Como o ultimo termo da Equajao (24) e constante, a variancia de (/S *) pode ser minimizada apenas pela 
manipula 9 ao do primeiro termo. Se fizermos 


a Equa^ao (24) reduz-se a 



( 25 ) 


= var (/J 2 ) 


Em palavras, com pesos w,, = k h que sao as pondera^oes de mmimos quadrados, a variancia do estimador 
linear fi* e igual a variancia do estimador de mmimos quadrados, senao, var (fi*) > var(/S 2 ). Dito de outro 
modo, se houver um estimador linear nao viesado de variancia minima de j 6 2 , deve ser o estimador de mmimos 
quadrados. Do mesmo modo, pode-se demonstrar que e um estimador linear nao viesado de variancia minima 
de Pi. 


3A.7 Consistency dos estimadores de mmimos quadrados 


Demonstramos que, na estrutura do modelo classico de regressao linear, os estimadores de mmimos qua¬ 
drados sao nao viesados (e eficientes) em qualquer tamanho de amostra: grande ou pequena. Mas as vezes, 
como foi visto no Apendice A, um estimador pode nao satisfazer uma ou mais propriedades estatisticas dese- 
javeis no caso das amostras pequenas. Mas a medida que o tamanho da amostra aumenta indefinidamente, os 
estimadores apresentam propriedades estatisticas desejaveis. Essas propriedades sao conhecidas como pro¬ 
priedades das amostras grandes ou propriedades assintoticas. Neste Apendice, examinaremos uma proprie- 
dade das amostras grandes, especificamente, a consistencia, discutida em mais detalhes no Apendice A. Ja 
mostramos que, no caso do modelo de duas variaveis, o estimador de MQO /1 2 e um estimador nao viesado do 
verdadeiro j 6 2 . Agora, veremos que f) 2 tambem e um estimador consistente de /S 2 .Como apresentado no Apen¬ 
dice A, uma condifao suficiente para a consistencia e que /3 2 seja nao viesado e que sua variancia tenda para 
zero a medida que o tamanho da amostra n, tende para o infinite). 

Como ja demonstramos a propriedade sem vies, agora precisamos apenas mostrar que a variancia de fi 2 
tende a zero quando n aumenta indefinidamente. Sabemos que 



(26) 


Dividindo o numerador e o denominador por n , nao alteramos a igualdade. 
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Assim, 


~ / a 2 /n \ 

lim var (f) 2 ) = lim , , = 0 

VE ( 27 ) 

n—too 71—>-oo 

ja que (1) o limite de um quociente e o limite do numerador dividido pelo limite do denominador (o que pode 
ser visto em qualquer manual de calculo); (2) como n tende para o infinite, a 2 /n tende a zero, pois a 2 e um 
numero finito; e x 2 )/n] ^ 0, porque a variancia de X tem um limite finito em decorrencia da Hipotese 7 do 
modelo classico de regressao linear. 

Do que foi visto, conclui-se que o estimador de MQO fi 2 e um estimador consistente do verdadeiro f) 2 . Da 
mesma forma, e posslvel verificar que /Sj tambem e um estimador consistente. Assim, em (pequenas) amostras 
repetidas, os estimadores de MQO sao nao viesados e, a medida que o tamanho da amostra cresce indefinida- 
mente, os estimadores de MQO sao consistentes. Como veremos mais adiante, mesmo se algumas das hipoteses 
do modelo classico de regressao linear nao forem atendidas, podemos obter estimadores consistentes dos coe- 
ficientes de regressao em varias situapfies. 





Capitulo 

Modelo classico de 
regressao linear normal 

(MCRLN) 

O que e conhecido como teoria classics da inferencia estatistica consiste em dois ramos: a 
estimacao e o teste de hipoteses. Ate agora, abordamos o tema da estima^ao dos parametros do mo¬ 
delo de regressao linear (com duas variaveis). Utilizando o metodo dos MQO, conseguimos estimar os 
parametros /3 h p 2 e o 2 - Sob as hipoteses do modelo classico de regressao linear, demonstramos que os es- 
timadores desses parametros, p\, fi 2 e a 2 , satisfazem varias propriedades estatisticas desejaveis, como 
a de nao vies, variancia minima etc. (Lembre-se da propriedade de melhor estimador linear nao vie- 
sado [ou nao tendencioso]: MELNT ou BLUE). Note que, como sao estimadores, seus valores muda- 
rao de amostra para amostra. Portanto, esses estimadores sao variaveis aleatorias. 

Mas a estimacao e metade do caminho. A outra metade e o teste de hipoteses. Lembre-se de que, na 
analise de regressao, nosso objetivo e nao apenas estimar a funcao de regressao amostral (FRA), mas 
tambem usa-la para fazer inferencias sobre a tuncao de regressao populacional (FRP), como enfatiza- 
mos no Capitulo 2. Entao, queremos saber ate que ponto p\ aproxima-se de /3 l ou quanto d 2 esta proxi¬ 
mo do verdadeiro cr. Por exemplo, no Exemplo 3.2 estimamos a FRA apresentada na Equagao (3.7.2). 
Mas como essa regressao esta baseada em uma amostra de 55 familias, como saberemos se a PMC esti- 
mada de 0,4368 representa a (verdadeira) PMC da populafao como um todo? 

Portanto, como /i h /i 2 e d 2 sao variaveis aleatorias, precisamos descobrir suas distribui 5 oes de 
probabilidade, pois, sem esse conhecimento, nao seremos capazes de relaciona-las a seus verdadeiros 
valores. 



4.1 A distribui^ao de probabilidade dos termos de erro 

Para descobrir as distributes de probabilidade dos estimadores de minimos quadrados ordina- 
rios, procedemos como a seguir. Especificamente, considere ft 2 - Como mostramos no Apendice 3A.2, 


h = Y, k i Y i 


(4.1.1) 


em que kj — x, j ^ xf. Mas, como supomos que os X sao fixos, ou nao estocasticos, porque nossa 
analise de regressao e condicional, ou seja, condicionada aos valores fixos de X h a Equa§ao (4.1.1) 
mostra que ji 2 e uma fun 5 ao linear de Y ,, que e aleatoria por hipotese. Devido ao fato de Y, = f J > ] + fi 2 
Xj + Ui, podemos escrever a Equaijao (4.1.1) como 

Pi — ^^kj(P\ + p 2 Xi + Li,) 
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(4.1.2) 
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Como k h os betas e X, sao todos fixos, f J > 2 e, em ultima analise, uma fungao linear da variavel alea¬ 
toria Up que e aleatoria por hipotese. Portanto, a distribuigao de probabilidade de fi 2 (e tambem de (i\) 
dependera da hipotese adotada sobre a distribuigao de probabilidade de u- r E, por ser necessario co- 
nhecer as distribuigoes de probabilidade dos estimadores de rmnimos quadrados ordinarios para 
fazer inferencias sobre seus valores populacionais, a natureza da distribuigao de probabilida¬ 
de de Uj assume um papel muito importante no teste de hipoteses. 

O metodo dos minimos quadrados ordinarios nao faz qualquer suposigao sobre a natureza proba- 
bilfstica de m,; ele e de pouca ajuda para inferencias sobre a fungao de regressao populacional com 
base nos resultados da fungao de regressao amostral, apesar do teorema de Gauss-Markov. Esse hiato 
pode ser preenchido se nos dispusermos a aceitar que os u seguem alguma distribuigao de probabili¬ 
dade. Por motivos explicados em breve, no contexto da regressao em geral supoe-se que os u sigam 
a distribuigao normal. Acrescentando a hipotese da normalidade para u, as hipoteses do modelo clas¬ 
sico de regressao linear examinado no Capftulo 3, obtemos o que se conhece por modelo classico de 
regressao linear normal (MCRLN). 


4.2 A hipotese de normalidade de it, 

O modelo classico de regressao linear normal supSe que cada m, seja distribufdo normal- 
mente com 


Media: 

E(uj) — 0 

(4.2.1) 

Variancia: 

E[u, — E(uj)] 2 — E[u ?) = o 2 

(4.2.2) 

cov ( Uj , uj): 

E{[(Ui - E(ui)][uj - E(uj)]} = E(ut uj) = 0 i / 

(4.2.3) 


Essas hipoteses podem ser representadas de modo mais compacto como 

m ~ N( 0, a 2 ) (4.2.4) 

em que o sfmbolo ~ significa distribuido como e N representa a distribuigao normal, os terrnos entre 
parenteses sao os dois parametros da distribuigao normal: a media e a variancia. 

Conforme observado no Apendice A, no caso de duas variaveis com distribuigao normal, 
covariancia ou correlagao iguais a zero signiflcam independence das duas variaveis. Dada a hipo¬ 
tese de normalidade, a Equagao (4.2.4) indica que m, e Uj nao estao correlacionados e sao distri- 
bufdos independentemente. 

Dessa forma, podemos escrever a Equagao (4.2.4) como 

Ui ~ NID (0, er 2 ) (4.2.5) 

em que NID representa normal e independentemente distribuido. 


Por que utilizamos a hipotese de normalidade? 

Por que utilizamos a hipotese de normalidade? Existem diversas razoes: 

1. De acordo com a Segao 2.5, u, representa a influencia combinada (sobre a variavel dependen- 
te) de um grande numero de variaveis nao inclufdas explicitamente no modelo de regressao. Espera¬ 
ntos que a influencia dessas variaveis omitidas ou negligenciadas seja pequena e, na melhor das 
hipoteses, aleatoria. O conhecido teorema central do limite (TCL) da estatfstica (veja o Apendice A 
para maiores detalhes) permite demonstrar que, se ha um grande numero de variaveis aleatorias 
independentes e com distribuigao identica, entao, com poucas excegoes, a distribuigao de suas somas 
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tende a distribuigao normal conforme o numero dessas variaveis aumenta indefinidamente. * 1 E o 
TCL que oferece uma justificativa teorica para a hipotese de normalidade de u,. 

2. Uma variante do TCL informa que, mesmo que o numero de variaveis nao seja muito grande 
ou que essas variaveis nao sejam estritamente independentes, sua soma ainda pode ser normalmen- 
te distribufda. 2 

3. Dada a hipotese de normalidade, a distribuigao de probabilidade dos estimadores de mmimos 
quadrados ordinarios pode ser facilmente derivada, porque, segundo o Apendice A, uma das pro- 
priedades da distribuiqao normal e que qualquer funcao linear de variaveis com distribuigao 
normal tambem e normalmente distribuida. Como ja discutimos, os estimadores de mmimos 
quadrados ordinarios e ft 2 sao funcbes lineares de u,. Portanto, se os it, estiverem normalmente 
distribufdos, e fi 2 tambem estarao, o que facilita muito nossa tarefa de testar as hipoteses. 

4. A distribuigao normal e comparativamente simples, envolvendo apenas dois parametros (me¬ 
dia e variancia); e muito conhecida e suas propriedades teoricas ja foram extensamente estudadas na 
estatrstica matematica. Alem disso, muitos fenomenos parecem seguir a distribuigao normal. 

5. Se estivermos lidando com uma amostra pequena, ou finita, por exemplo, com menos de 100 
observagoes, a hipotese de normalidade assume um papel fundamental. Ela nao so nos auxilia a derivar 
a distribuigao de probabilidade exata dos estimadores de mmimos quadrados ordinarios, mas tambem 
nos permite usar os testes estatrsticos, t, F e X , para modelos de regressao. As propriedades estatrsticas 
desses testes sao discutidas no Apendice A. Como mostraremos a seguir, se o tamanho da amostra for 
suficientemente grande, podemos relaxar a hipotese de normalidade. 

6. Por fim, em amostras grandes, as estatfsticas de t e F tem aproximadamente as distributes 
probabilfsticas de t e F de forma que os testes de t e F que se baseiam na hipotese de que o erro pa- 
drao tem distribuigao normal ainda possam ser aplicados validamente. 3 Hoje, ha muita informagao 
sobre corte transversal e temporais que possuem um numero razoavelmente grande de observagoes. 
Portanto, a hipotese de normalidade pode nao ser muito relevante em grandes conjuntos de dados. 

Uma advertencia: como estamos “impondo” a hipotese de normalidade, devemos verificar em apli- 
cagoes praticas envolvendo dados de amostras pequenas se ela e adequada. Mais a frente, apresentare- 
mos alguns testes que se destinam a isso e tambem veremos situagoes em que a hipotese de normalidade 
pode ser inadequada. Por enquanto continuaremos trabalhando com a hipotese de normalidade pelos 
motivos examinados anteriormente. 


4.3 Propriedades dos estimadores de MQO sob a hipotese 
de normalidade 

Dada a hipotese de que m, segue a distribuigao normal como na Equagao (4.2.5), os estimadores 
de mmimos quadrados ordinarios tem as seguintes propriedades (o Apendice A apresenta uma dis- 
cussao geral sobre as propriedades estatrsticas desejaveis dos estimadores): 

1. Sao nao viesados. 

2. Tem variancia minima. Combinado ao item 1, isso significa que eles sao estimadores nao viesados 
com variancia minima ou estimadores eficientes. 


1 Para uma discussao relativamente simples e objetiva deste teorema, veja ROSS, Sheldon M. Introduction to 
probability and statistics for engineers and scientists. 2. ed. Nova York: Harcourt Academic Press, 2000. p. 193- 
-194. Uma excegao ao teorema e a distribuigao de Cauchy, que nao tem media ou momentos mais elevados. 
Veja KENDALL, M. G.; STUART, A. The advanced theory of statistics. Londres: Charles Griffin & Co., 1960. v.1, 
p. 248-249. 

2 Para as varias formas do TCL, veja CRAMER, Harald. Mathematical methods of statistics. Princeton, NJ: Princeton 
University Press, 1946. cap. 17. 

3 Para uma discussao tecnica sobre este tema, veja HEIJ, Christiaan et al. Econometric methods with applications in 
business and economics. Oxford: Oxford University Press, 2004. p. 197. 
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3. Sao consistentes; a medida que o tamanho da amostra aumenta indefinidamente, os estimado- 
res convergem para os verdadeiros valores da populagao. 

4. Pi (que e uma fungao linear de u,) apresenta distribuigao normal com 

Media: 

var(ySi) 


E(Pi) = Pi 

EE 2 


"t = 


«E*,- 


(4.3.1) 
= (3.3.3) (4.3.2) 


Ou de modo mais compacto, 

Pi ~ N(Pi, er?) 


Pelas propriedades da di stri hu igao normal, a variavel Z, que e definida como 

z = ^l 


(4.3.3) 


segue a distribuigao normal padrao; uma distribuigao normal com media zero e variancia unitaria 
(= 1) ou 

Z ~ N(0, 1) 


5. Como p 2 (sendo uma fungao linear de up tern distribuigao normal com 


Media: 

vnr(p 2 ): 


ECPi) = Pi 



(4.3.4) 
= (3.3.1) (4.3.5) 


Ou, de modo mais compacto, 

h ~ N(p 2 , a| 2 ) 

Como na Equagao (4.3.3), 

P 2 p 2 


tambem segue a distribuigao normal padrao. A Figura 4.1 apresenta geometricamente as distribuigoes 
de probabilidades de Pi e p 2 . 

6. (n- 2)(o 2 /cr) segue a distribuigao de / 2 (qui-quadrado) com (» - 2) graus de liberdade. 4 Essa 
informagao nos ajuda a fazer inferencias a respeito do verdadeiro er com base em a 2 estimado, como 
mostraremos no Capftulo 5. (A distribuigao de qui-quadrado e suas propriedades sao discutidas no 
Apendice A.) 


4 A demonstragao desta afirmagao e um pouco complexa. Um fonte acessfvel e HOGG, Robert V.; CRAIG, Allen T. 
Introduction to mathematical statistics. 2. ed. Nova York: Mcmillan, 1965. p. 144. 
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FIGURA 4.1 

Distribuijao das 
probabilidades de 
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W) 



m 




7. A distribuigao de ((i\, fi 2 ) e independente de a 2 . A importancia disso sera explicada no proximo 
capitulo. 

8. e f5 2 P ossuem a variancia minima dentro da classe dos estimadores nao viesados, sejam li- 
neares ou nao. Esse resultado, formulado por Rao, e muito pertinente, pois, diferentemente do teorema 
de Gauss-Markov, nao se limita apenas a classe dos estimadores lineares. 5 Podemos dizer que os esti¬ 
madores de mfnimos quadrados ordinarios sao os melhores estimadores nao viesados (MELNT); 
eles tem a variancia minima na classe inteira de estimadores nao viesados. 

Resumindo: o importante a observar e que a hipotese de normalidade nos permite deduzir as 
distributes de probabilidade, ou amostrais, de (i\ e P 2 (ambas normais) e de cr (relacionada a qui- 
-quadrado). Como veremos no proximo capitulo, isso simplifica a tarefa de estabelecer intervalos de 
confian 9 a e de testar (estatisticamente) as hipoteses. 

Note tambem que, dada a hipotese de que «,• ~ N( 0, cr), Y h sendo uma fun 9 ao linear de u b tambem 
esta distribuido normalmente com media e variancia dadas por 

E(Yi) = ft + foXi 
var (Yi) = cr 2 

Ou, de modo mais elegante, 

Yi ~ N(fa + P 2 X h a 2 ) 


(4.3.7) 

(4.3.8) 

(4.3.9) 


4.4 O metodo da maxima verossimilhan^a (MV) 

Um metodo de estima 9 ao pontual com algumas propriedades teoricas mais fortes que as do me¬ 
todo dos minimos quadrados ordinarios e o da maxima verossimilhan^a (MV). Tratando-se de um 
metodo um tanto intrincado, sera discutido no apendice deste capitulo. Para o leitor em geral, e sufi- 
ciente observar que, se considerarmos a distribu^ao de w, normal, como fizemos pelas razoes ja 
examinadas, os estimadores de maxima verossimilhan 9 a e de minimos quadrados ordinarios dos coe- 
ficientes de regressao, os /S, serao identicos e isso e valido tanto para as regressoes simples quanto 
para as multiplas. O estimador de maxima verossimilharuja (MV) para o 2 e u 2 /n. Esse estimador 
e viesado, enquanto o estimador de minimos quadrados ordinarios de <r 2 = u j /(n — 2) e, como 


5 RAO, C. R. Linear statistical inference and its applications. Nova York: John Wiley & Sons, 1965. p. 258. 
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Resumo e 
conclusoes 


vimos, nao viesado. Mas, comparando esses dois estimadores de cr, vemos que, a medida que o ta- 
manho da amostra n aumenta, os dois estimadores de cr tendem a se igualarem. Dessa forma, assin- 
toticamente (quando n aumenta indefinidamente), o estimador de maxima verossimilhanca de a 1 2 3 4 5 6 7 8 9 10 
tambem e nao viesado. 

Como o metodo dos mfnimos quadrados acrescido da hipotese de normalidade de t/, nos oferece 
todas as ferramentas necessarias tanto para a estima§ao quanto para o teste de hipoteses dos modelos 
de regressao linear, nao ha perda para os leitores que nao se interessarem pelo metodo da maxima 
verossimilhanca em funcao de sua possfvel complexidade matematica. 


1. Este capftulo abordou o modelo classico de regressao linear normal (MCRLN). 

2. A diferenga entre este modelo e o modelo classico de regressao linear (MCRL) e que o primeiro 
supoe especificamente que o tenno de erro m, do modelo de regressao tem distribui?ao normal. O 
modelo de regressao linear classico nao requer qualquer hipotese sobre a distribui§ao de proba- 
bilidade m,; apenas exige que o valor medio de m, seja igual a zero e sua variancia seja uma cons- 
tante finita. 

3. A justificativa teorica da hipotese de normalidade e o teorema central do limite. 

4. Sem a hipotese de normalidade, sob as demais hipoteses examinadas no Capftulo 3, o teorema de 
Gauss-Markov mostrou que os estimadores de MQO sao os melhores estimadores lineares nao 
viesados (MELNT ou BLUE). 

5. Com a hipotese adicional de normalidade, os estimadores de MQO nao sao apenas melhores es¬ 
timadores nao viesados (MENT ou BUE), mas tambem seguem distributees de probabilidade 
conhecidas. Os estimadores de minimos quadrados ordinarios do intercepto e do coeficiente an¬ 
gular sao eles proprios normalmente distribuidos e o estimador de MQO da variancia de m, (= cr) 
relaciona-se a distribuicao qui-quadrado. 

6. Nos Capftulos 5 e 8 mostraremos como este conhecimento e util para inferences sobre os valores 
dos parametros populacionais. 

7. Uma alternativa ao metodo dos mfnimos quadrados e o da maxima verossimilhanca (MV). No 
entanto, para aplicar esse metodo, e preciso fazer uma suposicao sobre a distribuicao de proba¬ 
bilidade do termo de erro u r No contexto da regressao, a suposicao mais empregada e de que u ,■ 
segue a distribui 5 ao normal. 

8. Sob a hipotese de normalidade, os estimadores de MV e de MQO dos parametros do intercepto 
e do coeficiente angular do modelo de regressao sao identicos. No entanto, os estimadores de 
MQO e os de MV da variancia de m, sao diferentes. Em grandes amostras, os dois estimadores 
convergem. 

9. O metodo de maxima verossimilhanca e conhecido como metodo de amostras grandes. Ele tem 
uma aplicagao mais ampla, ja que tambem pode ser usado para modelos de regressao nao lineares 
nos parametros. Neste ultimo caso, o metodo dos MQO em geral nao e usado. Para mais detalhes, 
veja o Capftulo 14. 

10. Neste livro, usaremos muito o metodo dos mfnimos quadrados ordinarios por questoes praticas: 
(a) comparado ao metodo da maxima verossimilhanca, o dos mfnimos quadrados e facil de apli¬ 
car; ( b ) os estimadores de maxima verossimilhanca e os de mfnimos quadrados ordinarios de e 
sao identicos (o que tambem e valido para as regressoes multiplas); e (c) mesmo em amostras 
relativamente grandes, os estimadores de cr dos dois metodos citados nao diferem demasiada- 
mente. 

No entanto, para os leitores com mais inclinacao a matematica, apresentamos uma breve introducao 
ao metodo da maxima verossimilhanca no apendice a seguir e tambem no Apendice A. 
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Apendice 4A 


4A.1 Estima^ao de maxima verossimilhan^a de um modelo 
de regressao com duas variaveis 


Suponha que no modelo de duas variaveis F; = ft + ftA + u i os Y t sejam nonnal e independentemente dis- 
tribuidos, com media = ft+ ftX, e variancia = ft (Veja a Equagao (4.3.9). Em consequencia, a fungao de den- 
sidade de probabilidade conjunta de F b F 2 , . . . , Y„ , dadas a media e a variancia anteriores, pode ser escrita 
como 


/(F 1 ,F 2 ,...,F„|ft+AAft 2 ) 

Mas, tendo em vista a independence dos Y, essa fungao de densidade de probabilidade conjunta pode ser 
expressa como um produto de n fungoes de densidade individuals 

f(Y u Y 2 ,...,Y n \Pi+ fcXi, a 2 ) (1) 

= f(Yi I A + A Xi, cr 2 )f(Y 2 I A + A A, a 2 ) • ■ ■ f(Y n [ A + A Aft 2 ) 

em que 


f(Yi) 


a 


■= exp 
2tt 


1 (Yj - ft - ftA) 2 

2 a 2 


( 2 ) 


que e a fungao de densidade de uma variavel com distribuigao normal, dadas a media e a variancia. 
( Nota: exp significa e elevado a potencia da expressao indicada por {J.) 

Substituindo a Equagao (2) por cada na Equagao (1) obtemos 


/(F ; ,F 2 ,...,F„|ft+ftA,A) = 


2 


tt exp 


1 y- (Yi - ft - ftA) 2 
ft 


(3) 


Se ft, Y 2 , ..., Y n sao conhecidos ou dados, mas ft, ft e ° 2 nao sao, a fungao na Equagao (3) e chamada de 
fungao de verossimilhanga, denotada por FV(ft, ft e a 2 ), e expressa como 1 


FV(ft, ft, a 2 ) 


1 



1 y- (Yi - ft - ft A) 2 

2 ^ ft 


(4) 


O metodo da maxima verossimilhanga, como o nome indica, consiste em estimar os parametros desco- 
nhecidos de maneira que a probabilidade de observar os dados Y seja a maior (ou a maxima) possfvel. Precisa- 
mos encontrar o maximo da fungao na Equagao (4). Isso e um exercicio direto de calculo diferencial. Para 
derivar, e mais facil expressar a Equagao (4) na forma logaritmica, como a seguir. 2 {Nota: In = log natural.) 


n I ^ Y, - ft - ftX,) 2 

lnFV= -wlncr — -ln(2jr)- - V —- F 

2 v ' 9 4ft ft 


= -- lnft 
2 


n U { 2 n )- W ^-^- hXi)2 

2 2 4ft a* 


(5) 


Derivando a Equagao (5) parcialmente em relagao a ft, ft e cr 2 , obtemos 


9 In FV 

9ft 



^(E ; —ft — ftA)(—1) 


( 6 ) 


1 Obviamente, se ft, ft e 172 forem conhecidos, mas os Vjforem desconhecidos, a Equagao (4) representa 
a fungao de densidade de probabilidade conjunta — a probabilidade de observar conjuntamente os Y t . 

2 Como uma fungao log e uma fungao monotonica, In FV atingira seu valor maximo no mesmo ponto que FV. 
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3 In FV _ 1 

3jS 2 “ 


J2(Ji -Pi- foXiX-X,) 


(7) 


3 InFV n 1 


^(F - Pi - PlXi) 2 


da 2 2a 2 2cr 4 


( 8 ) 


Igualando essas equagoes a zero (condigao de primeira ordem para a otimizagao) e denotando os estimado- 
res de maxima verossimilhanga por /6 1; /S 2 e a 2 obtemos 3 



(9) 



( 10 ) 



( 11 ) 


Apos a simplificagao, as EquagSes (9) e (10) ficam como 



( 12 ) 


+P!j2Xi+P2j2 X f 


( 13 ) 


que sao exatamente as equagoes normals da teoria dos mmimos quadrados obtidas nas Equagoes (3.1.4) e (3.1.5). 
Portanto, os estimadores de maxima verossimilhanga, os/3, sao identicos aos estimadores de MQO, os p, dados 
nas Equagoes (3.1.6) e (3.1.7). Essa igualdade nao e acidental. Examinando a verossimilhanga (5), vemos que o 
ultimo termo entra com sinal negativo. Maximizar a Equagao (5) e o mesmo que minimizar esse termo, que e 
justamente o que faz a abordagem dos mmimos quadrados, como se pode ver na Equagao (3.1.2). 

Substituindo na Equagao (11) os estimadores de maxima verossimilhanga (= MQO) e simplificando, obte¬ 
mos o estimador de maxima verossimilhanga para o 2 como 




( 14 ) 


n 



Com base na Equagao (14) fica obvio que o estimador de maxima verossimilhangaCT 2 difere do estimador de 


MQO a 2 = [1 /(n — 2)] uj, que como ja foi demonstrado no Apendice 3A e um estimador nao viesados 


de a 2 . Assim, o estimador de maxima verossimilhanga de a 2 e viesado. A magnitude desse vies pode ser de- 
terminada com facilidade do seguinte modo: 


Tomando-se a esperanga matematica da Equagao (14) de ambos os lados, obtemos 




a 2 usando a Equagao (16) da Segao 3A.5 
do Apendice 3A 


( 15 ) 



n 

que mostra que a 2 e viesado para baixo (isto e, subestima o verdadeiro a 2 ) em amostras pequenas. Note que 


quando n, o tamanho da amostra, aumenta indefinidamente, o segundo termo na Equagao (15), o fator de vies, 


3 Usamos (til) para denotar os estimadores de MV e A (circunflexo) para os estimadores de MQO. 
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tende a zero. Portanto, assintoticamente (em amostras muito grandes), ci 2 tambem e nao viesado, ou seja, lim 
Eid 2 ) = a 2 quando n —> oo. Pode-se demonstrar adicionalmente que cr e tambem um estimador consistente 4 ; 
conforme n aumenta indefinidamente, cr 2 converge para seu valor verdadeiro a 1 . 


4A.2 Estima^ao de maxima verossimilhanga das despesas 
com alimenta^ao na India 


Volte ao Exemplo 3.2 e a Equagao (3.7.2), que mostram a regressao das despesas com alimentagao contra as 
despesas totals em 55 domicflios rurais na India. Como, sob a hipotese de nonnalidade, os estimadores dos coe- 
ficientes da regressao sao os mesmos nos metodos dos mrnimos quadrados ordinarios e da maxima verossimi¬ 
lhanga, obtemos os estimadores de MV como = ^ = ySj 94,2087 e /S 2 - th. = 0,4386. O estimador de MQO de o 2 
e S' 2 = 4.469,6913, mas o estimador de MV, cr =4.407,1563, que e menor que o estimador de MQO. Como obser- 
vado, em amostras pequenas, o estimador de maxima verossimilhan 9 a e viesado para baixo; subestima em me¬ 
dia a verdadeira variancia de a 2 . Naturalmente, como seria de esperar, quando o tamanho da amostra aumenta, 
a diferen 9 a entre os dois estimadores estreita-se. Inserindo os valores dos estimadores na fungao logaritmica de 
verossimillian 9 a, obtemos o valor de -308,1625. Se quiser o valor maximo da MV, basta encontrar o antilogaritmo 
de -308,1625. Nenhum outro valor dos parametros proporcionara uma probabilidade maior de obter a amostra 
utilizada na analise. 


Apendice 4A Exercfcios 

4.1. “Se duas variaveis aleatorias sao estatisticamente independentes, o coeficiente de correlagao entre elas e 
igual a zero. Mas o inverso nao e necessariamente verdadeiro, isto e, correlagao zero nao implica indepen¬ 
dence estatfstica. Contudo, se duas variaveis tern distribuigao normal, correlagao igual a zero implica ne¬ 
cessariamente independencia estatistica.” Verifique essa afirma 9 §o para a seguinte fun 9 ao de densidade de 
probabilidade conjunta de duas variaveis, E; e Y 2 , normalmente distribuldas (essa fungao de densidade de pro¬ 
babilidade conjunta e conhecida como fungao de densidade de probabilidade normal bivariada): 


f{Y u Y 2 ) 


1 

- , ex P 

2no\02y/\ — p 2 


1 

2(1 - P 2 ) 


( Yx-n i \ 2 _ (7i -Hi){Y 2 -n 2 ) + / E 2 -M2 \ 2 

V ffi / oi 0 2 \ a 2 ) 


em que = media de Y t 
fi 2 = media de Y 2 
0 \ = desvio padrao de Y { 
a 2 = desvio padrao de Y 2 
p = coeficiente de correla 9 §o entre Y\ e Y 2 

4.2. Aplicando as condigoes de segunda ordem para a otimizagao (teste da derivada segunda), mostre que o 
estimador de maxima verossimilhanga de /J b /J 2 e cr 2 obtidos pela solugao das Equagoes (9), (10) e (11) 
maximizam, de fato, a fungao de verossimilhanga na Equagao (4). 


4 Veja no Apendice A uma discussao geral das propriedades dos estimadores de maxima verossimilhanga, bem como 
a distingao entre propriedade assintotica de ausencia de vies e propriedade de consistency. Grosso modo, na proprie- 
dade assintotica de ausencia de vies, tentamos encontrar o lim (a 2 ) quando n tende ao infinito, em que neo tama¬ 
nho da amostra em que se embasa o estimador, enquanto na consistency, procuramos verificar como <r^ se 
comporta quando n aumenta indefinidamente. Note que a propriedade de nao vies e de amostragem repetida de 
um estimador baseado em uma amostra de dado tamanho, enquanto na consistency estamos preocupados com o 
comportamento de um estimador a medida que a amostra aumenta indefinidamente. 
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4.3. Uma variavel aleatoria X segue a distribuigao exponencial se tem a seguinte fungao de densidade de proba- 
bilidade: 

f(X) = (1 /6)e~ xle para X >0 

= 0 nos demais casos 

em que 8 > 0 e o parametro da distribuigao. Usando o metodo de maxima verossimilhanga, mostre que o 
estimador de MV de 8 e 8 = V X; In , em que ne o tamanho da amostra. Ou seja, mostre que o estimador 
de maxima verossimilhanga de 86 a media amostral X. 

4.4. Suponha que o resultado de um experimento seja classificado apenas como um sucesso ou um fracasso. No- 
meando X = 1 quando o resultado e um sucesso e X = 0 quando e um fracasso, a fungao de densidade de 
probabilidade, ou massa, de X 6 dada por 


p(X = 0)=l-p 
p(X = l) = p, 0 < p < 1 

Qual o mais provavel estimador de p, a probabilidade de sucesso? 


Capitulo 

A regressao de duas 
variaveis: estimagao 
de intervalo e teste de 
hipoteses 

Cuidado para nao testar hipoteses demais; quanto mais voce tortura os dados, maior a probabilidade de 

que confessem, mas tal confissao pode nao ser admissivel no tribunal da opiniao cientifica. * 1 

Como destacado no Capitulo 4, a estimagao e o teste de hipoteses sao os dois ramos principals da 
estatfstica classica. A teoria da estimagao consiste em duas partes: a estimagao pontual e a de interva¬ 
lo. Nos dois capftulos anteriores, abordamos em detalhes a estimagao pontual quando apresentamos 
os metodos dos mfnimos quadrados ordinarios e da maxima verossimilhanga da estimagao pontual. 
Neste capitulo, abordaremos primeiro a estimagao de intervalo e entao examinaremos o teste de hi¬ 
poteses, um topico estreitamente relacionado a estimagao de intervalo. 

5.1 Pre-requisitos estatfsticos 

Antes de demonstrar a mecanica do estabelecimento de intervalos de confianga e o teste estatisti- 
co de hipoteses, supoe-se que o leitor esteja familiarizado com os conceitos fundamentais de proba¬ 
bilidade e de estatfstica. Embora nao seja um substituto de um curso basico de estatfstica, o 
Apendice A apresenta os conceitos estatfsticos essenciais que o leitor deveria conhecer bem. Concei¬ 
tos fundamentais, como probabilidade, distributes de probabilidade, erro do tipo I e II, nfvel 
de significance, potencia dos testes estatfsticos e intervalos de confianga, sao imprescindfveis 
para entender o conteudo deste e dos proximos capftulos. 



5.2 Estimativa de intervalo: algumas ideias basicas 

Para fixar as ideias, considere novamente o exemplo da relagao entre salario e escolaridade do 
Capitulo 3. A Equagao (3.6.1) mostra que o aumento medio no salario-hora em relagao ao aumento 
de um ano na escolaridade (/C) e de 0,7240, que representa uma unica estimativa (pontual) do valor 
desconhecido da populagao /t 2 . Ate que ponto essa estimativa e confiavel? Conforme observado no 
Capitulo 3, devido a variagoes amostrais, uma unica estimativa provavelmente sera diferente do 


1 STICLER, Stephen M. "Testing hypothesis or fitting models? Another look at mass extinctions". In: NITECKI, Matthew 
H.; HOFFMAN, Antoni (Coord.). Neutral models in biology. Oxford: Oxford University Press, 1987. p. 148. 
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verdadeiro valor, embora em amostras repetidas espera-se que seu valor medio seja igual ao valor verda- 
deiro. ( Nota: E( p 2 ) — P 2 ) Na estatlstica, a confiabilidade de um estimador pontual e medida por seu 
erro padrao. Em vez de tomarmos como base apenas a estimativa pontual, podemos construir um in¬ 
tervalo em torno de um estimador pontual por exemplo, de dois ou tres erros padrao de cada lado do 
estimador pontual, de modo que esse intervalo tenha, por exemplo, 95% de probabilidade de incluir o 
verdadeiro valor do parametro. Essa e a ideia que esta por tras da estimacao de intervalo. 

Para ser mais especifico, suponha que queiramos verificar quanto fi 2 esta “proximo” de P 2 . Para 
tanto, tentamos encontrar dois numeros positivos Sea, este ultimo situado entre 0 e 1, tais que a pro¬ 
babilidade de que o intervalo aleatorio (P 2 — S, fi 2 + 8) contenha o verdadeiro fi 2 seja 1 — a. Simbo- 
licamente. 


Pr(p 2 - 8 <p 2 <P 2 + 8 ) = l-a (5.2.1) 

Esse intervalo, quando existe, e conhecido como intervalo de confianpa; 1 — a, como coefi- 
ciente de confianpa; e a (0 < a < 1), como nivel de significancia. 2 Os pontos extremos do inter¬ 
valo de confianpa sao os limites de confianpa (ou valores criticos). P 2 — 8 e o limite inferior de 
confianpa e p 2 + 8 e o limite superior de confianpa. Note que, na pratica, a e 1 — a muitas vezes sao 
expressos em percentuais, como 100a e 100(1 — a)%. 

A Equapao (5.2.1) mostra que um estimador de intervalo, ao contrario do pontual, e um intervalo 
construido de tal modo que tem uma probabilidade especificada 1 — a de incluir em seus limites o 
verdadeiro valor do parametro. Por exemplo, se a = 0,05, ou 5%, leremos a Equapao (5.2.1) como “a 
probabilidade de que o intervalo (aleatorio) mostrado nela inclua o verdadeiro p 2 e de 0,95 ou 95%”. 
Assim, o estimador de intervalo proporciona uma faixa dentro da qual o verdadeiro p 2 pode se situar. 

E muito importante conhecer os seguintes aspectos da estimapao de intervalo: 

1. A Equapao (5.2.1) nao indica que a probabilidade de p 2 que se situa entre os limites dados seja 
de 1 — a. Pelo fato de supormos que P 2 , embora desconhecida, seja algum numero fixo, ou 
esta dentro do intervalo ou nao esta. A Equapao (5.2.1) informa que, para o metodo descrito 
neste capftulo, a probabilidade de estabelecer um intervalo que contenha p 2 e de 1 — a. 

2. O intervalo na Equapao (5.2.1) e um intervalo aleatorio, isto e, variara de amostra para amos- 
tra, porque se baseia em p 2 , que e aleatorio. (Por que?) 

3. Como o intervalo de confianpa e aleatorio, as probabilidades relacionadas a ele devem ser 
entendidas a longo prazo, isto e, sob amostras repetidas. Mais especificamente, a Equapao 
(5.2.1) significa: se, em amostras repetidas, intervalos de confianpa semelhantes forem esta- 
belecidos muitas vezes com base na probabilidade de 1 — a, entao, a longo prazo, em media, 
esses intervalos incluirao, em 1 — a dos casos, o verdadeiro valor do parametro. 

4. Como mencionado no item 2, o intervalo na Equapao (5.2.1) e aleatorio enquanto p 2 for des- 
conhecido. Mas, uma vez que contarmos com uma amostra especifica e tivermos o valor nu- 
merico especifico de p 2 , o intervalo na Equapao (5.2.1) deixa de ser aleatorio; esta fixado. 
Nesse caso, nao podemos fazer a afirmapao probabilistica na Equapao (5.2.1); nao podemos 
dizer que ha uma probabilidade de 1 — a de que um dado intervalo fixado inclua o verdadeiro 
P 2 - Nessa situapao, P 2 ou esta dentro do intervalo fixado ou fora dele. Portanto, a probabilidade 
sera de 1 ou 0. Para nosso exemplo salario-escolaridade, se o intervalo de confianpa de 95% 
fosse calculado como (0,5700 < P 2 < 0,8780), como faremos a seguir na Equapao (5.3.9), nao 
poderiamos afirmar que haveria uma probabilidade de 95% de que esse intervalo incluisse o 
verdadeiro (i 2 . A probabilidade seria de 1 ou de 0. 


2 Tambem conhecido como probabilidade de cometer um erro do Tipo I. Este erro consiste em rejeitar uma 
hipotese verdadeira, enquanto o erro de Tipo II representa a aceitapao de uma hipotese falsa. (Este topico e 
discutido com mais detalhe no Apendice A.) O sfmbolo a e tambem conhecido como tamanho do teste 
(estatistico). 
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Como sao estabelecidos os intervalos de confianga? Com base na discussao anterior, pode-se esperar 
que se as distributes amostrais ou de probabilidade dos estimadores forem conhecidas, e posstvel 
fazer afirmagoes sobre intervalos de confianga como a Equagao (5.2.1). No Capitulo 4, vimos que, sob a 
hipotese de normalidade dos termos de erro u h os estimadores de MQO de P\ e (> 2 sao eles proprios 
normalmente distribuidos e que o estimador de MQO de fr 2 relaciona-se a distribuigao / 2 (qui-qua- 
drado). Parece entao que a tarefa de estabelecer intervalos de confianga e simples. E e mesmo! 


5.3 Intervalos de confianga para os coeficientes e 
da regressao 


Intervalo de confianga para /J 2 

Na Segao 4.3 do Capitulo 4 mostramos que, dada a hipotese de normalidade para u h os estimado¬ 
res de mfnimos quadrados ordinarios p x e p 2 sao eles proprios normalmente distribuidos com medias 
e variancias dadas. Portanto, por exemplo, a variavel 


Pi ~ Pi 
ep (Pi) 

(Pi - Pl)y/E4 


(5.3.1) 


de acordo com a Equagao (4.3.6), e uma variavel normal padronizada. Parece que podemos empregar 
a distribuigao normal para afirmagoes probabilisticas sobre p 2 contanto que a verdadeira variancia da 
populagao, a 2 , seja conhecida. Se cr for conhecida, uma propriedade importante de uma variavel nor¬ 
malmente distribmda com media /i e variancia cr e que a area sob a curva normal entre u ± cr corres- 
ponde a cerca de 68%, aquela entre os limites de ± 2er e de cerca de 95% e a que esta entre f t ± 3cr 
e de cerca de 99,7%. 

Mas cr raramente e conhecida e, na pratica, e determinada pelo estimador nao viesado cr. Se 
substitmrmos cr por a , a Equagao (5.3.1) podera ser escrita como 


Pi ~ Pi 
ep (Pi) 


Estimador — Parametro 
Erro padrao estimado do estimador 


(Pi ~ Pi)^f 

o 


(5.3.2) 


em que o ep (P 2 ) agora se refere ao erro padrao estimado. Pode-se demonstrar (veja a Segao 5A.2 do 
Apendice 5A) que a variavel t assim definida segue a distribuigao t com n — 2 graus de liberdade. 
(Note a diferenga entre as Equagoes (5.3.1) e (5.3.2).) Em vez de usarmos a distribuigao normal, po¬ 
demos usar a distribuigao t para estabelecer um intervalo de confianga para p 2 como a seguir: 


Pr (~t a /2 < t < t a /i) — l- a 


(5.3.3) 


em que o valor t entre a dupla desigualdade e o valor t dado pela Equagao (5.3.2) e t u22 e o valor da 
variavel t obtido na distribuigao t para um nivel de significance a/2 e n — 2 graus de liberdade; mui- 
tas vezes e chamado de valor critico de t em um nivel de significance de a/2. Substituindo a Equagao 
(5.3.2) na Equagao (5.3.3), obtemos 


Pr 



Pi ~ Pi 
ep (Pi) 


< t a /2 


— 1 — a 


(5.3.4) 
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Reorganizando a Equagao (5.3.4), obtemos 

Pr [Pi ~ t a / 2 ep (p 2 ) < Pi < Pi + t«/i ep (yS 2 )] = 1 - « 


(5.3.5) 3 4 


A Equa 5 ao 5.3.5 oferece um intervalo de eonfiani;a de 100(1 — a)% para p 2 , que pode ser escri- 
to de modo mais compacto como: 


Intervalo de confianpa 100(1 — a)% para P 2 : 

h ± t a / 2 ep (Pi) 

Com um argumento analogo e usando as Equa 9 oes (4.3.1) e (4.3.2), podemos escrever: 


(5.3.6) 


Pr [Pi - t a/2 ep (Pi) < Pi < Pi + t a/2 ep (3i)] = 1 - a 


(5.3.7) 


ou, de modo mais compacto: 

Intervalo de confian 9 a 100(1 — a)% para /3 1: 

Pi ± t a / 2 ep(Pi) (5.3.8) 

Observe uma caracterlstica importante dos intervalos de confian^a dados nas Equa 9 oes (5.3.6) e 
(5.3.8): nos dois casos a amplitude do intervalo de confianga eproporcional ao erropadrao do estima- 
dor. Quanto maior o erro padrao, maior a amplitude do intervalo de confian 9 a. Em outras palavras, 
quanto maior o erro padrao do estimador, maior e a incerteza da estima 9 ao do verdadeiro valor do pa- 
rametro desconhecido. O erro padrao de um estimador e muitas vezes descrito como uma medida da 
precisao do estimador (da exatidao com que o estimador mede o verdadeiro valor da popula 9 ao). 

Voltando a nosso exemplo de regressao no Capitulo 3 (Se 9 ao 3.6) da rela 9 ao entre salario me¬ 
dio por hora (E) e escolaridade (X), lembre-se de que verificamos na Tabela 3.2 que P 2 — 0,7240, 
ep (Pi) = 0,0700. Como ha 13 observa 9 oes, os graus de liberdade sao 11. Supondo que a = 5%, ou 
seja, um coeficiente de confian 9 a de 95%, a tabela t mostra que para 11 graus de liberdade, o valor 
critico t a / 2 = 2,201. Substituindo esses valores na Equa 9 ao (5.3.5), o leitor verificara que o intervalo 
de confian 9 a de 95% para P 2 e o seguinte: 4 


0,5700 < /3 2 < 0,8780 (5.3.9) 

Ou, usando a Equa 9 ao (5.3.6), e 

0,7240 ± 2,201 (0,0700) 


isto e, 


0,7240 ±0,1540 


(5.3.10) 


3 Alguns autores preferem escrever a Equagao (5.3.5) indicando explicitamente os graus de liberdade. Assim, te- 
rfamos: 

Pr [p2 — \n-2),ct/2eplfil) < P2 < @2+ t[n-2)a/2ep Q 2 )] = 1 — « 

Mas, para simplificarmos, manteremos nossa notagao; o contexto esclarece os graus de liberdade envolvidos. 

4 Devido ao arredondamento dos erros na Tabela3.2, as respostas dadas podem nao corresponder exatamente as 
respostas obtidas do pacote estatfstico. 
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A interpretagao desse intervalo de confianga e: dado o coeficiente de confianga de 95%, a longo 
prazo, em 95 de cada 100 casos, os intervalos como a Equagao (5.3.9) conterao o verdadeiro fa Mas, 
como advertimos, nao podemos dizer que existe uma probabilidade de 95% de que o intervalo especf- 
fico na Equagao (5.3.9) contenha o verdadeiro fa porque agora o intervalo esta fixado e deixou de ser 
aleatorio; portanto, ou (fi esta dentro dele ou nao esta: a probabilidade de que o intervalo fixado espe- 
cificado inclua o verdadeiro ffi e de I ou 0. 

Seguindo a Equagao (5.3.7) e os dados da Tabela 3.2, o leitor verificara facilmente que o interva¬ 
lo de confianga de 95% para o de nosso exemplo e 

-1,8871 < Pi < 1,8583 (5.3.11) 

Novamente, e preciso estar atento ao interpretar esse intervalo de confianga. Em 95 de cada 100 
casos, intervalos como a Equagao 5.3.11 conterao o verdadeiro /Jp a probabilidade de que esse inter¬ 
valo fixado inclua o verdadeiro e de 1 ou 0. 

Intervalos de confianga simultaneos para fa e fa 

Ha ocasioes em que e preciso estabelecer um intervalo de confianga conjunto para /3\ e fa de tal 
modo que, com um coeficiente de confianga (1 — a) de, por exemplo, 95%, esse intervalo inclua e 
/S 2 simultaneamente. Como este topico e complexo, o leitor interessado pode querer consultar uma 
bibliografia adequada. 5 Discutiremos este assunto rapidamente nos Capitulos 8 e 10. 


5.4 Intervalo de confianga para o 2 


Como destacado na Segao 4.3 do Capftulo 4, sob a hipotese de normalidade, a variavel 

2 d 2 

X~ = (n- 2 )^ (5.4.1) 

segue a distribuigao de y 2 com n — 2 graus de liberdade. 6 Portanto, podemos usar a distribuigao de/ 2 
para estabelecer um intervalo de confianga para er: 

Pr {xi-c /2 <X 2 < Xa/i) = 1 - « (5.4.2) 


FIGURA 5.1 

O intervalo de 
confianga de / 2 com 
95% (11 graus de 
liberdade). 


f(X 2 ) 



5 Uma discussao acessfvel pode ser encontrada em NETER, John; WASSERMAN, William; KUTNER, Michael H. Ap¬ 
plied linear regression models. Homewood, 111: Richard D. Irwin, 1983. cap. 5. 

6 Para uma demonstragao veja HOGG, Robert V.; CRAIG, Allen T. Introduction to mathematical statistics. 2. ed. 
Nova York: Macmillan, 1965. p. 144. 
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2 

em que o valor da distribui^ao de X no meio dessa dupla desigualdade e dado pela Equagao (5.4.1) 
2 2 2 2 
onde Xi - a /2 e X a / 2 sao dois valores de X (os valores cnticos de X ) obtidos na tabela de qui-quadrado 

para n — 2 graus de liberdade, de modo que eles excluem 100(a/2)% das areas caudais da di stribuigao 

de qui-quadrado, como mostra a Figura 5.1. 

Substituindo x 2 da Equa§ao (5.4.1) na Equa§ao (5.4.2) e reorganizando os termos, obtemos: 


Pr 


< t 2 2 a 2 

(n-2)— <a 2 <(n-2)— - 

Xa/2 Xl-a/2 


= 1 — a 


(5.4.3) 


o que nos da o intervalo de confian^a 100(1 — a)% para a 2 . 

Continuando com nosso exemplo salarios-escolaridade, encontramos na Tabela 3.2 que para nos- 
sa base de dados temos a 2 = 0,8936. Se escolhermos a de 5%, a tabela de qui-quadrado para 11 graus 

7 2 

de liberdade fornece-nos os seguintes valores cnticos: Xo,025 = 21,9200 e X0.975 = 3,8157. Esses va¬ 
lores mostram que a probabilidade de que um valor de qui-quadrado seja superior a 21,9200 e de 
2,5% e a 3,8157 e de 97,5%. Portanto, o intervalo entre esses dois valores e o intervalo de confian 9 a 
de 95% para x 2 , como mostra a Figura 5.1. (Note a caracterfstica assimetrica da distribu^ao de qui- 
-quadrado.) 

Substituindo os dados de nosso exemplo na Equac^ao (5.4.3), o leitor verificara que o intervalo de 
confian 9 a de 95% para treo seguinte: 

0,4484 < er < 2,5760 (5.4.4) 

A interpretacao desse intervalo e: se estabelecermos limites de confian 9 a de 95% em a 2 e se man- 
tivermos a priori que esses limites incluem o verdadeiro a 2 , estaremos certos 95% das vezes a longo 
prazo. 


5.5 Teste de hipoteses: comentarios gerais 

Depois de discutirmos o problema das estima 9 oes pontuais e de intervalos, consideraremos o 
teste de hipoteses. Nesta segao, discutiremos rapidamente certos aspectos gerais; o Apendice A apre- 
senta alguns detalhes adicionais. 

O problema do teste estatistico de hipoteses pode ser resumido da seguinte maneira: determinada 
observagao 011 resultado e ou nao compativel com alguma hipotese feita? Apalavra “compativel” 
aqui significa “suficientemente proxima” do valor pressuposto, de modo que nao rejeitamos a hipo¬ 
tese feita. Se alguma teoria ou experimento anterior levar-nos a acreditar que o verdadeiro coeficien- 
te angular /t 2 do exemplo salario-escolaridade seja igual a unidade, esse fi 2 — 0,724 obtido da amostra 
da Tabela 3.2 sera consistente com a hipotese feita? Se for, nao rejeitamos a hipotese; caso contrario, 
podemos rejeita-la. 

Na linguagem da estatfstica, a hipotese estabelecida e denominada hipotese nula e e denotada 
pelo sfmbolo H 0 . A hipotese nula e, em geral, testada contra uma hipotese alternativa (tambem co- 
nhecida como hipotese mantida), denotada por // h que pode afirmar, por exemplo, que o verdadeiro 
/J 2 e diferente da unidade. A hipotese alternativa pode ser simples ou composta. 7 Por exemplo, //,: 
P 2 = 1,5 e uma hipotese simples; mas //,: # 1,5 e uma hipotese composta. 

A teoria do teste de hipoteses trata da formula 9 ao de regras ou procedimentos a serem adotados 
para decidir se a hipotese nula deve ser rejeitada ou nao. Ha duas abordagens mutuamente comple- 


7 Uma hipotese estatfstica e chamada de hipotese simples se especifica o(s) valor(es) exato(s) dos parametros de 
uma fungao de densidade de probabilidade; caso contrario, e chamada de hipotese composta. Por exemplo, na FDP 
normal (I/o' 2rr)exp{-0,5[(X - /i)/<r] 2 }, se afirmamos que H^: /x = 15 e a = 2, trata-se de uma hipotese sim¬ 
ples; mas se /r = 15 e rr > 15, trata-se de uma hipotese composta, porque o desvio padrao nao tern um valor 
especffico. 
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mentares para a elaboragao dessas regras, especificamente, intervalo de confianga e teste de signi¬ 
ficance. Ambas postulam que a variavel (estatfstica ou estimador) sendo considerada tem alguma 
distribuigao de probabilidade e que o teste de hipoteses envolve a formulagao de declaragoes ou afir- 
magoes sobre o(s) valor(es) do(s) parametro(s) dessa distribuigao. Por exemplo, sabemos que, de 
acordo com a hipotese de normalidade, /S 2 distribui-se normalmente com media igual a (i 2 e variancia 
dada pela Equagao (4.3.5). Se propomos a hipotese de que f J > 2 — 1, estamos fazendo uma afirmagao 
sobre um dos parametros da distribuigao normal, a saber, a media. A maioria das hipoteses estatfsticas 
apresentadas neste livro sera deste tipo — afirmagoes sobre um ou mais dos parametros de alguma 
distribuigao de probabilidade determinada tal como a normal, a F, a t, ou X 2 . As duas segoes a seguir 
mostrarao como isso e feito. 


5.6 Teste de hipoteses: a abordagem do intervalo de confianga 
Teste bilateral ou bicaudal 

Para ilustrarmos a abordagem do intervalo de confianga, voltaremos mais uma vez ao exemplo do 
salario-escolaridade. Com base nos resultados da Equagao (3.6.1), sabemos que o coeficiente angular 
e 0,7240. Postulemos que 


H 0 : ft = 0,5 
Hi : / 0,5 

isto e, que o verdadeiro coeficiente angular e 0,5 sob a hipotese nula, mas menor ou maior que 0,5 sob 
a hipotese altemativa. A hipotese nula e uma hipotese simples, enquanto a hipotese alternativa e com- 
posta; o que e conhecido como hipotese bilateral. Muitas vezes essas hipoteses alternativas bilaterais 
refletem o fato de que nao temos uma expectativa forte a priori ou teorica sobre a diregao em que a 
hipotese alternativa deveria diferenciar-se da hipotese nula. 

O /S 2 observado e compativel com H 0 ? Para respondermos a essa pergunta, voltemos ao intervalo 
de confianga na Equagao (5.3.9). Sabemos que a longo prazo intervalos como (0,5700, 0,8780) con- 
terao, com 95% de probabilidade, o verdadeiro valor de /%. Consequentemente, a longo prazo (em 
amostras repetidas), esses intervalos proporcionam faixas ou limites dentro dos quais o verdadeiro /% 
pode situar-se com um coeficiente de confianga de, por exemplo, 95%. O intervalo de confianga ofere- 
ce um conjunto de hipoteses nulas plausfveis. Se /C sob H 0 cair no intervalo de confianga de 100( 1 — a)%, 
nao rejeitaremos a hipotese nula; se estiver situada fora desse intervalo, poderemos rejeita-la. 8 Essa 
faixa e ilustrada esquematicamente na Figura 5.2. 


FIGURA 5.2 

Intervalo de confianga 
de 100(1 - a)% 
para /S 2 . 
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sao plausfveis segundo H Q com 100( 1 - a)% 
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. de confianga. Portanto, nao rejeite H Q se 
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| situar-se nesta regiao. 
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1 
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K~ t aJ2 e vCPd 3 2 + %2 e P(^2) 


8 Tenha sempre em mente que ha uma chance de 100o , % de que o intervalo de confianga nao contenha p 2 s °h 
H 0 mesmo que a hipotese seja correta. Em resumo, ha uma chance de 100£y% de cometer um erro do Tipo I. 
Assim, se a for igual a 0,05, ha 5% de chances de que possamos rejeitar a hipotese nula mesmo que ela seja 
correta. 
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Regra de Estabelega um intervalo de confianga de 100(1 — a)% para f) 2 . Se fi 2 sob H 0 situar-se no intervalo 

decisao de confian^a, nao rejeite H 0 , mas, se cair fora desse intervalo, rejeite H 0 . 


Seguindo essa regra, no caso de nosso exemplo hipotetico, H 0 : p 2 — 0,5 claramente esta fora do 
intervalo de confianpa de 95% dado na Equapao (5.3.9). Portanto, podemos rejeitar a hipotese de que 
a verdadeira inclinapao e de 0,5 com 95% de confianpa. Se a hipotese nula fosse verdadeira, a proba- 
bilidade de obtermos um valor de inclinagao de pelo menos 0,7240 por puro acaso ou sorte seria de 
no maximo 5%, uma probabilidade pequena. 

Em estatfstica, quando rejeitamos a hipotese nula, dizemos que nossos resultados foram estatisti- 
camente significativos. Por outro lado, quando nao rejeitamos a hipotese nula, dizemos que nossos 
resultados nao sao estatisticamente significativos. 

Alguns autores usam a expressao “alta significancia estatistica”. Com isso, em geral querem dizer 
que, quando rejeitam a hipotese nula, a probabilidade de cometer um erro do Tipo I (isto e, a) e um 
numero pequeno; em geral, 1%. Mas como nossa discussao sobre o valor p, na Segao 5.8 mostrara, 
e melhor deixar que o pesquisador decida se um resultado estatistico e “significativo”, “moderada- 
mente significativo” ou “muito significativo”. 

Teste unilateral ou unicaudal 

As vezes, temos uma forte expectativa a priori ou teorica (ou expectativas embasadas em algum 
trabalho empfrico anterior) de que a hipotese alternativa seja unilateral ou unidirecional em vez de bi¬ 
lateral, como acabamos de ver. Para nosso exemplo salario-escolaridade, seria possfvel postular que: 

H 0 : /3 2 < 0,5 e Hp. p 2 > 0,5 

Talvez a teoria economica ou trabalhos empfricos anteriores sugiram que a inclinagao seja maior que 
0,5. Embora o procedimento para testar essa hipotese seja facilmente deduzido a partir da Equagao 
(5.3.5), a mecanica talvez seja melhor explicada em termos da abordagem do teste de significancia 
examinado a seguir. 9 


5.7 Teste de hipoteses: a abordagem do teste de significancia 


Teste de significancia dos coeficientes de regressao: o teste t 

Uma abordagem alternativa, mas complementar, ao metodo do intervalo de confianpa para o 
teste de hipoteses estatfsticas e a abordagem do teste de significancia formulado segundo texto de 
R. A. Fisher e texto conjunto de Neyman e Pearson. 10 Em termos gerais, um teste de significancia 
e um procedimento em que os resultados amostrais sao usados para verificar a veracidade ou a 
falsidade de uma hipotese nula. A ideia fundamental por tras dos testes de significancia e a de um 
teste estatistico (estimador) e a distribuigao amostral dessa estatfstica sob a hipotese nula. A decisao 
de aceitar ou rejeitar H 0 e tomada com base no valor do teste estatistico dos dados disponfveis. 

Para ilustrar, lembre-se de que, sob a hipotese de normalidade, a variavel 


Pi ~ Pi 
ep (Pi) 

(Pi - PtijM 


(5.3.2) 


9 Se desejar usar a abordagem do intervalo de confianga, use um teste unilateral ou unicaudal de 100( I — a)% 
para ft 2 - P° r que? 

10 Detalhes podem ser encontrados em LEHMAN, E. L. Testing statistical hypotheses. Nova York: John Wiley & 
Sons, 1959. 
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segue a distribuigao t com n — 2 graus de liberdade. Se o valor do verdadeiro fi 2 e especificado sob a 
hipotese nula, o valor t na Equagao (5.3.2) pode ser facilmente calculado para a amostra disponfvel e, 
portanto, pode servir como teste estatfstico. E, como o teste estatistico segue a distribuigao t, podemos 
fazer afirmagoes de intervalo de confianga como a seguinte: 


Pr 


-ta/2 < 


tk~, 


ep (Pi) 


< ta/2 


= 1 


(5.7.1) 


em que /Jo e o valor de /J 2 sob H 0 e —t a , 2 e t a n sao os valores de t (os valores criticos de t) obtidos na 
tabela t para o nivel de significancia (a/2) e n — 2 graus de liberdade (Equagao (5.3.4)). A tabela t 
consta do Apendice D. 

Reorganizando a Equagao (5.7.1), obtemos 


Pr [P 2 ~ t a/ 2 ep Cpi) <p 2 < Pi + ta /2 ep (fa)] = 1 - a (5.7.2) 

que nos fomece o intervalo em que /J 2 caira dentro da probabilidade 1 — a, dado fi 2 — (f 2 . Na lingua- 
gem do teste de hipoteses, o intervalo de confianga de 100( 1 — a)% estabelecido na Equagao (5.7.2) e 
conhecido como regiao de aceitagao (da hipotese nula) e a(s) regiao{oes) fora do intervalo de confianga 
e (sao) chamada(s) de regiao(5es) de rejeigao (de H 0 ) ou de regiao(oes) crftica(s). Como observado, 
os limites de confianga, os pontos extremos do intervalo de confianga, tambem sao chamados de va¬ 
lores criticos. 

A estreita conexao entre as abordagens de intervalo de confianga e de teste de significancia para o 
teste de hipoteses pode agora ser vista comparando a Equagao (5.3.5) com a Equagao (5.7.2). No 
procedimento de intervalo de confianga tentamos estabelecer uma faixa ou intervalo com certa pro¬ 
babilidade de incluir o valor verdadeiro, mas desconhecido, de /J 2 , enquanto na abordagem do teste 
de significancia supusemos o valor de /A e tentamos ver se o f> 2 calculado esta dentro de limites ra- 
zoaveis (confiaveis) em torno desse valor hipotetico. 

Mais uma vez voltemos ao exemplo de salario-escolaridade. Sabemos que /C = 0,7240, ep (p 2 ) = 
0,0700 e graus de liberdade (gl) = 11. Se supusermos a — 5%, t a / 2 = 2,201. 

Se considerarmos H 0 : f> 2 — P* 2 — 0,5 e //,: fi 2 ± 0,5, a Equagao (5.7.2) torna-se 

Pr (0,3460 < P 2 < 0,6540) (5.7.3) 11 


conforme o diagrama da Figura 5.3. 

Na pratica, nao ha necessidade de estimar a Equagao (5.7.2) explicitamente. Podemos calcular o 
valor t no meio da dupla desigualdade dada pela Equagao (5.7.1) e verificar se ele se situa entre os 
valores criticos de t ou fora deles. No nosso exemplo, 


t 


0,7240 - 0,5 
0,0700 


= 3,2 


(5.7.4) 


Que claramente se situa na regiao critica da Figura 5.4. A conclusao permanece a mesma; rejeita- 
mos H 0 . 

Note que, se o /3 2 estimado (= j3 2 ) for igual ao fi 2 hipotetico, o valor t na Equagao (5.7.4) sera zero. 
Pelo fato de o valor estimado de f J > 2 ser diferente do valor hipotetico de ji 2 , Irl (o valor absoluto de t. 
Nota: t pode ser tanto positivo quanto negativo) sera cada vez maior. Portanto, um valor Id “grande ” 
sera uma evidencia contra a hipotese nula. Obviamente, sempre podemos usar a tabela t para deter- 
minar se determinado valor t e grande ou pequeno; a resposta depende dos graus de liberdade, assim 


11 Na Segao 5.2, item 4, afirmamos que nao podemos dizer que haja uma probabilidade de 95% de que o inter¬ 
valo fixado (0,5700, 0,8780) inclua o verdadeiro ft 2 - Mas podemos fazer a afirmagao probabilfstica dada na 
Equagao (5.7.3), porque /§ 2 , sendo um estimador, e uma variavel aleatoria. 
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FIGURA 5.3 

Intervalo de 
confianpa de 
95% para sob 
a hipotese de 
que p 2 = 0,5. 


FIGURA 5.4 

O intervalo de 
confianpa 
de 95% para 
1(11 gl). 


m) 



m 



como da probabilidade de um erro de Tipo I que estamos dispostos a aceitar. Se voce examinar a 
tabela t do Apendice D, vera que, para cada valor dado dos graus de liberdade, a probabilidade de 
obter um valor Irl cada vez maior torna-se progressivamente menor. Assim, para 20 graus de liberda¬ 
de, a probabilidade de obter um valor Id de 1,725 ou maior e de 0,10% ou 10%, mas, para os mesmos 
graus de liberdade, a probabilidade de obter um valor Id de 3,552 ou maior e de apenas 0,002% ou 
0 , 2 %. 

Como usamos a distribui£ao t, o procedimento de verificac^ao e chamado de teste t. Na linguagem 
dos testes de significancia, uma estatistica e dita significativa se o valor do teste estatistieo situar-se 
na regiao critica. Nesse caso, a hipotese nula e rejeitada. Do mesmo modo, um teste e considerado 
estatisticamente insignificante (ou nao signifieativo) se o valor do teste estatistieo situar-se na regiao 
de aceita^ao. Nesse caso, a hipotese nula nao e rejeitada. Em nosso exemplo, o teste t e signifieativo e, 
portanto, rejeitamos a hipotese nula. 

Antes de concluirmos nossa discussao sobre teste de hipoteses, note que os procedimentos que 
acabamos de delinear sao conhecidos como testes de significancia bilaterais ou bicaudais, pois con- 
sideramos os dois extremos da distribui§ao de probabilidade relevantes, as regioes de reje^ao, e rejeita¬ 
mos a hipotese nula se esta situar-se em qualquer das caudas. Isso acontece, porque nossa //, era uma 
hipotese composta bilateral; fi 2 ^ 0,5 significa que /C e maior ou menor que 0,5. Mas suponha que 
uma experiencia anterior sugerisse que a inclinaijao deveria ser maior que 0,5. Nesse caso, te- 
mos H 0 \ p 2 < 0>5 e Hp. P 2 > 0>5. Embora//! ainda seja uma hipotese composta, agora e unilateral. 
Para testa-la, recorremos a um teste unicaudal (a cauda direita), como mostra a Figura 5.5. (Veja 
tambem a Se 5 ao 5.6.) 

O procedimento de teste e o mesmo que o anterior, exceto o limite de confian?a superior ou valor 
crftico, que agora corresponde a t a — f 0 5 , isto e, o nfvel de 5%. Como a Figura 5.5 mostra, neste caso 
nao precisamos considerar a cauda inferior da distribu^ao t. Usar um teste de significancia unicaudal 
ou bicaudal dependera de como a hipotese alternativa e formulada, a qual, por sua vez, pode depender 
de alguma considera 5 ao a priori ou de uma experiencia empirica anterior. (Veremos mais a respeito 
disso na Se 5 ao 5.8.) 
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FIGURA 5.5 

Teste de significancia 
unicaudal. 





Podemos resumir a abordagem do teste t de significancia nos testes de hipoteses confonne mostra 
a Tabela 5.1. 


TABELA 5.1 

Regras de decisao 
para o teste t de 
significancia 


Tipo de 

Ho: hipotese 

Hi: Hipotese 

Regra de decisao: 

Hipotese 

nula 

Alternativa 

rejeitar H 0 se 

Bicaudal 

= @2 

P 2 # @2 

1 f 1 > t a /2,g\ 

Cauda direita 

P2 < P 2 

&2 > 

t > ta,gl 

Cauda esquerda 

&2 > @2 

&2 < P 2 

f~+- 

A 

1 

tb_ 


Notas: /3* e o valor numerico hipotetico de /? 2 . 

Id e o valor absoluto de t. 

t a ou t a i 2 representa o valor crftico t no nrvel de significancia a ou a/2. 

gl: graus de liberdade: (n — 2) para o modelo de duas variaveis, (n — 3) para o modelo de tres variaveis e assim por diante. 
O mesmo procedimento aplica-se ao teste de hipoteses para 


Teste de significancia para a 2 : o teste de qui-quadrado (x 2 ) 

Para ilustrar de outro modo a metodologia dos testes de significancia, considere a seguinte variavel: 


X 2 — ( n — 2) — 


a- 


(5.4.1) 


que, como mencionado, segue a distribu^ao de / 2 com n — 2 graus de liberdade. Tomemos o exem- 
plo hipotetico a 2 — 0,8937 e gl = 11. Se postulamos que H Q : a 2 = 0,6 versus Hf. a 2 A 0,6, a Equa^'ao 
(5.4.1) oferece o teste estatlstico para H Q . Substituindo pelos valores adequados na Equagao (5.4.1), 
verificamos que, para H 0 , X 2 = 16,3845. Se supusermos que a — 5%, os valores crfticos de X 2 sao 
3,81575 e 21,9200. Como o X 2 calculado situa-se nesses limites, os dados sustentam a hipotese nula e 
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TABELA 5.2 

Um resumo do 
teste x 2 


Nota: <7q, e o valor de a 2 sob a hipotese nula. O primeiro subscrito de x 2 na ultima coluna e o nivel de significancia e o segundo refere-se aos 
graus de liberdade. Esses sao os valores criticos de x 2 Observe que os graus de liberdade sao (n — 2) para o modelo de regressao de duas 
variaveis, (n — 3) para o modelo de regressao de tres variaveis e assim por diante. 


H 0 : hipotese nula 

Hp hipotese alternativa 

Regra de decisao: rej'eitar H 0 se 

a 2 = ff 2 

a 2 > rr 2 

gl( <7 2 ) 2 

2 ql 

&0 

O 2 =O 2 0 

a 2 < a 2 

gl( 6 2) 2 
oi X(1 - a) '9' 

o 2 = (T 2 

CT^ff 2 

gl( 0 2) 2 
(TO X “ /2 ' 91 



° U < ^0 —a/2),gl 


nao a rejeitamos. (Veja a Figura 5.1.) Esse procedimento de teste e chamado de teste de significancia 
qui-quadrado. A abordagem do teste y 2 de significancia para o teste de hipoteses esta resumida na 
Tabela 5.2. 


5.8 Teste de hipoteses: alguns aspectos praticos 


O sentido de "aceitar" ou "rejeitar" uma hipotese 

Se, com base em um teste de significancia, por exemplo, o teste t, decidirmos “aceitar” a hipotese 
nula, tudo o que estamos dizendo e que, com base na evidencia amostral, nao temos razoes para re- 
jeita-la; nao estamos dizendo que a hipotese nula e sem sombra de duvida verdadeira. Por que? Para 
responder, volte ao nosso exemplo de salarios-escolaridade e suponha que H 0 : ft 2 — 0,70. Agora, o 
valor estimado da inclinatjao e fi 2 = 0,7241, com um erro padrao de (Jii) = 0,0701. Com base no 


teste t, verificamos que t — 


(0,7241 - 0,7) 


= 0,3438, que e insignificante a» = 5%. Portanto, deci- 


0,0701 

dimos “aceitar” H 0 . Mas suponhamos que Ily. fi 2 = 0,6. Aplicando o teste t novamente, obtemos 
(0,7241 - 0,6) 

t = - — -— 1,7703, que tambem e estatisticamente insignificante. Entao, podemos “aceitar” 

essa //(,. Qual das duas hipoteses nulas e “verdadeira”? Nao sabemos. Ao aceitanuos a hipotese nula, de- 
vemos sempre ter em mente que outra hipotese nula pode ser igualmente compativel com os dados. E 
preferivel dizermos que e possivel aceitar a hipotese nula em vez de dizer que a aceitamos. Melhor ainda. 


[...] tal como um juri emite um veredicto de “nao culpado” em vez de “inocente”, a conclusao de um 
teste estatistico e “nao rejeitamos” em vez de “aceitamos”. 12 


A hipotese nula "zero" e a regra pratica "2 -t' 

Uma hipotese nula muito testada empiricamente e H 0 : f J > 2 — 0, ou seja, o coeficiente angular e 
igual a zero. Essa hipotese nula “zero” e uma especie de testa de ferro, cujo objetivo e descobrir se Y 
esta relacionado de alguma forma a X, a variavel explanatoria. Se a princi'pio nao existe nenhuma 
rela 5 ao entre Y e X, testar uma hipotese como fi 2 — 0,3 ou qualquer outro valor nao faz nenhum sentido. 


12 


KMENTA, Jan. Elements of econometrics. Nova York: Macmillan, 1971. p. 114. 
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Essa hipotese nula pode ser testada facilmente pelas abordagens do intervalo de confianga ou do 
teste t, vistas na se£ao anterior. Mas muitas vezes o teste formal pode ser contornado adotando-se a 
regra “ 2-C de significancia, que pode ser expressa como: 


Regra pratica Se o numero de graus de liberdade for de 20 ou mais e se a, o nivel de significancia, for definido em 

“2-t” 0,05, a hipotese nula = 0 pode ser rejeitada se o valor f calculado por meio da Equa^ao (5.3.2) 

for maior que 2 em valor absoluto. 


A logica dessa regra nao e diffcil de entender. Da Equa^ao (5.7.1), sabemos que rejeitaremos H 0 : 
P 2 = 0 se: 


t = /f 2 /ep(j6 2 ) > 4/2 


quando > 0 


ou: 


t — 32/ep(/S 2 ) < -t a/2 


quando /1 2 < 0 


ou quando 


I? I 


h 

ep (fii) 


> 4/2 


(5.8.1) 


para graus de liberdade apropriados. 

Agora, se examinarmos a tabela t apresentada no Apendice D, veremos que, para todos os graus 
de liberdade de 20 ou mais, um valor t calculado maior que 2 (em termos absolutos) e estatisticamen- 
te significativo no nivel de 5%, implicando a reje^ao da hipotese nula. Se verificarmos que com 20 
ou mais graus de liberdade o valor de t sera de 2,5 ou 3, nao precisaremos nem mesmo consultar a 
tabela t para avaliar a significancia dos coeficientes angulares calculados. E claro que sempre pode- 
mos consultar a tabela t para obter o nivel exato de significancia, e devemos consulta-la sempre que 
os graus de liberdade forem menores que, por exemplo, 20. 

Note que, se estamos testando a hipotese unilateral fi 2 = 0 contra f> 2 > 0 ou fj 2 < 0, devemos rejeitar 
a hipotese nula se: 


1*1 


h 

ep(/S 2 ) 


> 4 


(5.8.2) 


Se fixarmos a em 0,05, verificaremos na tabela t que, com 20 ou mais graus de liberdade, um 
valor t superior a 1,73 e estatisticamente significativo no nivel de 5% de significancia (unilateral). 
Sempre que um valor t for maior que, por exemplo, 1,8 (em termos absolutos) e os graus de liberdade 
forem 20 ou mais, nao sera necessario consultar a tabela para verificar a significancia do coeficiente 
observado. E claro, se escolhermos a em 0,01 ou qualquer outro nfvel, teremos de decidir sobre o 
valor adequado de t como marco de referenda. Mas, a esta altura, o leitor ja esta apto para isso. 


Elaboragao das hipoteses nula e alternativa 13 

Dadas as hipoteses nula e alternativa, testar sua significancia estatistica ja nao deve ser um miste- 
rio. Mas como formula-las? Nao ha regras rigorosas. Muitas vezes o fenomeno estudado sugere a 
natureza das hipoteses nula e alternativa. Por exemplo, considere a linha do mercado de capitals 
(LMC) da teoria do portfolio que postula que E, — + /f 2 a„ em que E = retorno esperado sobre o 

portfolio e a = desvio padrao do retorno, uma medida de risco. Pelo fato de esperar-se que exista 


IB 


Para uma discussao interessante sobre a formulafao de hipoteses veja LONG, J. Bradford; LANG, Kevin. "Are all 
economic hipotheses fals e?"journal of Political Economy 1992. v. 100, n. 6, p. 1.257-1272. 
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uma relaqao positiva entre retorno e risco — quanto mais alto o risco, maior o retorno —, a hipotese 
alternativa natural a hipotese nula f J > 2 = 0 seria ( J > 2 > 0. Ou seja, nao se consideraria os valores de f J > 2 
menores que zero. 

Mas suponha o caso da demanda por moeda. Como mostraremos mais adiante, um dos determi- 
nantes importantes da demanda por moeda e a renda. Estudos anteriores sobre as fun£6es de deman¬ 
da por moeda mostram que a elasticidade renda da demanda (a varia§ao percentual da demanda por 
moeda decorrente do aumento de 1% na renda), em geral, situa-se entre 0,7 e 1,3. Em um novo estu- 
do da demanda por moeda, se postularmos que o coeficiente elasticidade-renda fi 2 c I, a hipotese al¬ 
ternativa sera (i 2 ± 1, uma hipotese alternativa bilateral. 

Assim, e possfvel basear-se em expectativas teoricas ou trabalhos empfricos anteriores, ou em am- 
bos, para formular as hipoteses. Mas qualquer que seja o modo de formula§ao das hipoteses, e da 
maior importancia que o pesquisador defina essas hipoteses antes de levar adiante a pesquisa empiri- 
ca. Caso contrario, sera acusado de raciocfnio evasivo ou de profecias autorrealizaveis. Se as hipoteses 
forem formuladas depois de examinar os resultados empfricos, pode-se cair na tenta£ao de elaborar 
hipoteses que justifiquem os resultados obtidos. Essa pratica deve ser evitada a todo custo, no minimo, 
em prol da objetividade cientifica. Ten ha em mente a citacjao de Stigler que abre o capitulo! 

Escolhendo a, o nfvel de significancia 

Do que foi dito ate aqui, deve estar claro que rejeitar ou nao a hipotese nula depende fundamen- 
talmente de a, o nivel de significancia ou a probabilidade de cometer um erro do Tipo I — a proba- 
bilidade de rejeitar a hipotese verdadeira. No Apendice A, discutiremos em detalhe a natureza de um 
erro do Tipo I, sua relagao com um erro do Tipo II (a probabilidade de aceitarmos a hipotese falsa) e 
por que a estatistica classica concentra-se, de modo geral, no erro do Tipo I. Mas, mesmo assim, por 
que a e em geral fixado nos niveis de probabilidade de 1%, 5% ou no maximo 10%? Na realidade, 
nao ha nada de especial nesses valores, quaisquer outros funcionariam igualmente bem. 

Em um livro introdutorio como este, nao e possfvel examinar em profundidade os motivos pelos 
quais escolhemos niveis de significancia de 1%, 5% ou 10%, pois levaria-nos ao campo da tomada de 
decisao estatistica, que e uma disciplina em si. No entanto, podemos oferecer um breve resumo. 
Como discutiremos no Apendice A, para um dado tamanho de amostra, se tentamos reduzir um erro 
do Tipo /, o erro do Tipo II aumenta e vice-versa. Dado o tamanho da amostra, se tentamos reduzir a 
probabilidade de rejeitar a hipotese verdadeira, estamos, ao mesmo tempo, aumentando a possibili- 
dade de aceitar a falsa. Portanto, ha um trade-off (dilema ou escolha conflitiva) entre esses dois tipos 
de erro, dado o tamanho da amostra. 

A linica forma de resolver o dilema e descobrir o custo relativo dos dois tipos de erro. Entao, 

...Se o erro de rejeitar a hipotese nula, que na verdade e verdadeira (erro do Tipo I), for custoso em 
rela 9 §o ao erro de nao a rejeitar quando ela for de fato falsa (erro do Tipo II), sera racional definir 
uma probabilidade baixa para o primeiro tipo de erro. Se, por outro lado, o custo de cometer um erro 
do Tipo I for baixo em rela?ao ao custo de cometer um erro do Tipo II, compensara definir uma 
probabilidade alta para o primeiro tipo de erro (tomando baixa a probabilidade do segundo tipo de 
erro)... 14 

Obviamente, a questao e que raramente conhecemos o custo de cometer os dois tipos de erros. Na 
econometria aplicada, em geral segue-se a pratica de definir o valor de a em 1%, 5% ou no maximo 
10% e escolher um teste estatistico que torne a probabilidade de cometer um erro do Tipo II a menor 
possivel. Como 1 menos a probabilidade de cometer um erro do Tipo II e conhecido como a potencia 
do teste, esse procedimento equivale a maximizar a potencia do teste. (Veja o Apendice A para uma 
discussao sobre a potencia dos testes.) 

Felizmente, o dilema de escolher um valor de a adequado pode ser evitado usando o que e conhe¬ 
cido como valor p do teste estatistico, que sera discutido a seguir. 


u 


KMENTA, Jan. Elements of econometrics. Nova York: Macmillan, 1971. p. 126-127. 
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O nfvel de significance exato: o valor p 

Como acabamos de mencionar, o calcanhar de Aquiles do teste de hipoteses e a arbitrariedade 
na selegao de a. Uma vez obtido o teste estatfstico (por exemplo, o teste t) em um dado exemplo, 
por que nao simplesmente consultar a tabela estatistica adequada e verificar a probabilidade efe- 
tiva de obter um valor do teste estatistico tao grande ou maior que o obtido no exemplo? Essa 
probabilidade e denominada valor p (o valor da probabilidade), tambem conhecida como nivel 
de significancia exato ou observado ou probabilidade exata de cometer um erro do Tipo I. 
Mais tecnicamente, o valor p e definido como o menor nivel de significancia em que uma hipo- 
tese nula pode ser rejeitada. 

Para ilustrarmos, voltemos ao nosso exemplo da relaijao salarios-escolaridade. Dada a hipotese 
nula de que o verdadeiro coeficiente de escolaridade e de 0,5, obtivemos um valor t de 3,2 na Equagao 
(5.7.4). Qual e o valor p de obter um valor t igual ou maior que 3,2? Consultando a tabela de t do 
Apendice D, observamos que, com 11 graus de liberdade, a probabilidade de obter tal valor I deve 
ser menor que 0,005 (unilateral) ou 0,0010 (bilateral). Se usar os pacotes estatisticos Stata ou EViews, 
vera que o valor p de obten£ao de um valor t de 3,2 ou maior e de cerca de 0,0001, ou seja, e extre- 
mamente pequeno. Esse e o valor p da estatistica t observada. O nivel exato de significancia observa¬ 
do da estatistica t e muito menor que o nivel de significancia fixado de maneira convencional, e 
arbitraria, como 1 %, 5% ou 10%. Na realidade, se fossemos usar o valor p que acabamos de calcular 
e rejeitar a hipotese nula de que o verdadeiro coeficiente de cducaqao e de 0,5, a probabilidade de 
cometermos um erro de Tipo I seria de apenas 1 em 100.000! 

Como observado, se os dados nao sustentam a hipotese nula, o Ifl obtido sob a hipotese nula sera 
“grande” e, portanto, o valor p da obten 9 ao de tal valor Ifl sera “pequeno”. Em outras palavras, para 
determinado tamanho de amostra, quando Irl aumenta, o valor p diminui, e, por conseguinte, e possf- 
vel rejeitar a hipotese nula com maior confianga. 

Qual a relaijao entre o valor p c o nivel de significancia a? Se nos acostumarmos a fixar a igual ao 
valor p de um teste estatfstico (como a estatistica f), nao havera conflito entre os dois valores. Em 
outras palavras, e melhor abrir mao de fixar a arbitrariamente em algum nfvel e apenas escolher 
o valor p do teste estatfstico. 

E preferivel deixar ao leitor a decisao de rejeitar ou nao a hipotese nula a um dado valor p. Se, em 
uma aplica£ao, o valor p em um teste estatfstico for de 0,145% ou 14,5% e se o leitor desejar rejeitar 
a hipotese nula neste (exato) nivel de significancia, que assim seja. Nao ha nada de mau em arriscar 
estar errado em 14,5% das vezes se voce rejeitar a hipotese nula verdadeira. Do mesmo modo, como 
em nosso exemplo salarios-escolaridade, nao ha nada de errado se o pesquisador escolher um valor p 
de 0,02% e nao correr o risco de estar errado mais do que 2 em 10 mil vezes. Afinal, alguns pesqui- 
sadores podem ser adeptos ao risco e outros avessos a ele. 

No restante do livro, citaremos o valor p de determinado teste estatistico. Alguns leitores preferi- 
rao fixar a em algum nfvel e rejeitar a hipotese nula se o valor p for menor que a. A escolha e deles. 

Significancia estatistica versus significancia pratica 

Volte ao Exemplo 3.1 e aos resultados da regressao da Equaqao (3.7.1). Essa regressao relaciona 
as despesas pessoais de consumo (DPC) e o P1B nos Estados Unidos para o periodo 1960-2005, am- 
bas as variaveis medidas em bilhoes de dolares de 2000. 

Com base nessa regressao, vemos que a propensao marginal a consumir (PMC), isto e, o consumo 
adicional como resultado de 1 dolar adicional de renda (conforme medido pelo P1B) e de cerca de 
0,72, ou aproximadamente de 72 centavos. Com os dados da Equa^ao (3.7.1), o leitor pode verificar 
que o intervalo de confian^a de 95% para o PMC e (0,7129, 0,7306). ( Nota: como ha 44 gl neste 
problema, nao temos um valor t crftico preciso para tal grau de liberdade. Consequentemente, voce 
pode usar a regra pratica 2 — 1 para calcular o intervalo de confian^a de 95%.) 

Suponha que alguem afirme que a verdadeira PMC seja de 0,74. Esse numero e diferente de 0,72? 
Sera se nos ativermos estritamente ao intervalo de confianqa definido anteriormente. 
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Mas qual a significance pratica ou substantiva de nossa conclusao? Que diferenfa faz dizer que 
assumimos que a PMC e de 0,74 nao de 0,72? Essa diferen^a de 0,02 entre as duas PMC e tao impor- 
tante na pratica? 

A resposta depende do que pretendemos fazer com as estimativas. Por exemplo, a macroecono- 
mia nos ensina que o multiplicador da renda e 1/(1 — PMC). Portanto, se a PMC e de 0,72, o multi- 
plicador e de 3,57, mas sera de 3,84 se a PMC for de 0,74. Assim, se o govemo resolvesse aumentar seus 
gastos em $ 1 para tirar a economia de uma recessao, a renda acabaria aumentando em $ 3,57, se 
a PMC fosse de 0,72, mas aumentaria em $ 3,84, se a PMC fosse de 0,74. E essa diferenqa poderia ser 
fundamental para a recupera£ao da economia. 

O importante nessas consideraqoes e que nao devemos confundir significdncia estatistica com 
significancia pratica ou econdmica. Como observa Goldberger: 

...Quando uma hipotese nula, digamos /S ; = 1, e especificada, o que se quer dizer e que esta proximo de 
1, tao proximo que para todos os fins pode ser tratado como se fosse 1. Mas o fato de 1,1 ser ...‘praticamente 
a mesma coisa que’... 1,0 e uma questao economica, nao estatistica. Nao e posslvel decidir a questao 
baseando-se em um teste de hipoteses, porque o teste estatfstico mede o coeficiente estimado em unidades 
de erro padrao, que nao se prestam a medigao do parametro economico /3 ; — 1. Talvez seja uma boa ideia 
reservar o tenno “significancia” para o conceito estatistico e adotar ...“substantial”... para o conceito 
economico... 15 

A questao levantada por Goldberger e importante. A medida que o tamanho da amostra torna-se 
muito grande, a significancia estatistica perde importancia, mas os aspectos de significancia econo¬ 
mica passam a ser fundamentals. De fato, com amostras muito grandes praticamente nenhuma hipo¬ 
tese nula sera rejeitada, havera casos em que a grandeza das estimativas pontuais sera o unico ponto 
a discutir. 

A escolha entre as abordagens do intervalo de confian^a e do teste de 
significancia no teste de hipoteses 

Na maioria das analises de economia aplicada, a hipotese nula e definida como testa de ferro e o 
objetivo da analise empirica e derruba-la, ou seja, rejeitar a hipotese nula. No exemplo da rela£ao 
entre consumo e renda, a hipotese nula de que a PMC /3 2 = 0 e obviamente absurda, mas muitas vezes 
recorremos a ela para aumentar o impacto dos resultados empificos. Aparentemente, os editores de 
periodicos famosos nao consideram empolgante publicar artigos empmcos em que a hipotese nula 
nao seja rejeitada. Parece que a verificaqao de que a PMC e estatisticamente diferente de zero e mais 
digna de manchetes do que a constata§ao de que ela e igual, por exemplo, a 0,7. 

Assim, J. Bradford De Long e Kevin Lang argumentam que e melhorpara os economistas 

[...] concentrarem-se na grandeza dos coeficientes e infonnar os niveis de confianca em vez dos testes 
de significancia. Se todas ou quase todas as hipoteses nulas sao falsas, faz pouco sentido especular se 
uma estimativa pode ser distinguida ou nao do seu valor previsto sob a hipotese nula. Em vez disso, 
queremos lanfar luz sobre quais modelos sao boas aproximafoes, o que requer que conhegamos as 
faixas de valores dos parametros excluidas das estimativas empiricas. 16 

Em resumo, esses autores preferem a abordagem do intervalo de confian 9 a a do teste de signifi¬ 
cancia. Talvez o leitor deva manter esse conselho em mente. 17 


15 GOLDBERGER, Arthur S. A course in econometrics. Cambridge, Massachusetts: Harvard University Press, 1991. 
p. 240. Note que bj e o estimador de MQO para Pj e a b j e seu erro padrao. Para uma opiniao neste mesmo 
sentido, veja MCCLOSKEY, D. N. "The loss function has been mislaid: the rhetoric of significance tests." Ameri¬ 
can Economic Review, 1985. v. 75, p. 201-205. Veja tambem MCCLOSKEY, D. N.; ZILIAK, S. T. "The standard 
error of regression." Journal of Economic Literature, 1996. v. 37, p. 97-114. 

16 Veja o artigo dos autores citado na nota de rodape 1 3, p. 1.271. 

17 Para uma perspectiva diferente, veja HILL, Carter; GRIFFITHS, William; JUDGE, George. Undergraduate econome¬ 
trics. Nova York: Wiley & Sons, 2001. p. 108. 
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5.9 Analise de regressao e analise de variancia 

Nesta segao estudaremos a analise de regressao sob o ponto de vista da analise de variancia e 
apresentaremos ao leitor uma forma esclarecedora e complementar de examinar o problema da infe- 
rencia estatfstica. 

Na Segao 3.5 do Capftulo 3, formulamos a seguinte identidade: 


E?« ? = E^ 2 +E# = & I2 x ? + E' 


(3.5.2) 


ou seja, STQ = SQE + SQR, que decompoe a soma total dos quadrados (STQ) em dois componentes: 
soma dos quadrados explicados pela regressao (SQE) e soma do quadrado dos resfduos (SQR). Um 
estudo desses elementos da STQ e conhecido como analise de variancia (ANOVA) do ponto de vista 
da regressao. 

Associados a qualquer soma de quadrados estao seus graus de liberdade, o numero de observa- 
goes independentes em que se embasa. A STQ tem n — 1 gl, porque perdemos 1 gl ao calcular a media 
da amostra Y. A SQR tem n — 2 gl. (Por que?) ( Nota: isso e verdadeiro apenas para o modelo de re¬ 
gressao com duas variaveis com o intercepto presente.) A SQE tem 1 gl (novamente, isso e valido 
apenas no caso de duas variaveis), que resulta do fato de que SQE = x j ® uma b-incao apenas 
de E x h visto que e conhecida. 

Vamos organizar as varias somas de quadrados e os graus de liberdade correspondentes na Tabela 
5.3, que e a forma padrao de uma tabela de analise de regressao, muitas vezes chamada tabela ANO¬ 
VA. Dadas as entradas da Tabela 5.3, consideremos agora a seguinte variavel: 


F 


VINO de SQE 
MSQ de SQR 

4 2 E *, 2 

2 ) 


(5.9.1) 


Se supormos que os termos de erro u, sejam normalmente distribufdos, como fazemos no modelo 
classico de regressao linear normal, e se a hipotese nula ( H 0 ) e fi 2 — 0 , pode-se demonstrar que a 
variavel F da Equac:ao (5.9.1) segue a distribui^ao F com 1 gl no numerador e (n — 2) gl no denomi- 
nador. (Veja a demonstra 5 ao na Se?ao 5A.3 do Apendice 5A. As propriedades gerais da distribui^ao 
F sao discutidas no Apendice A.) 

Como podemos usar a razao F2 Podemos demonstrar 18 que: 


E*?) 


E- 


(5.9.2) 


TABELA 5.3 

Tabela ANOVA para 
o modelo de regressao 
de duas variaveis 


Fonte da Variagao 

SQ* 

gi 

MSQ* 

Devido a regressao (SQE) 

£y; =/SfX > 2 

i 

PiEx? 

Devido aos resfduos (SQR) 

ZQf 

n — 2 

n—2 

STQ 

Zyf 

n — 1 



*SQ significa soma dos quadrados. 

f Media da soma dos quadrados, obtida dividindo-se SQ pelos graus de liberdade correspondentes. 


Para uma demonstra^ao, veja BROWNLEE, K. A. Statistical theory and methodology in science and engineering. 
Nova York: John Wilev & Sons, 1960. p. 278-280. 
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TABELA 5.4 

Fonte de variagao 

SQ 

gi 

MSQ 


Tabela ANOVA para 
o exemplo de 

Devido a regressao (SQE) 

95,4255 

i 

95,4255 

95,4255 

0,8811 

= 108,3026 

consumo e renda 

Devido aos resfduos (SQR) 

9,6928 

ii 

0,8811 


STQ 

105,1183 

12 



e 

n - 

M 2 , 2 

' = E{6 2 ) = 
-2 

a 1 


(5.9.3) 


(Note que j J > 2 e er, no lado direito dessas equagoes, sao os verdadeiros parametros.) Portanto, se /3 2 
for de fato zero, as Equagoes (5.9.2) e (5.9.3) proporcionarao estimativas identicas do verdadeiro er 2 . 
Nesta situagao, a variavel explanatoria X nao tem nenhuma influencia linear sobre Y e toda a varia- 
gao de Y e explicada pelos disturbios aleatorios w ; . Se, por outro lado, p 2 nao for zero, as Equagoes 
(5.9.2) e (5.9.3) serao diferentes e parte da variagao de Y sera atribm'da a X. Portanto, a razao F da 
Equagao (5.9.1) proporciona um teste da hipotese nula // 0 : fi 2 — 0. Como todas as quantidades que 
entrant nessa equagao podem ser obtidas por meio da amostra disponfvel, essa razao F oferece um 
teste estatistico para verificar a hipotese nula de que o verdadeiro fi 2 e igual a zero. Tudo o que pre- 
cisamos fazer e calcular a razao F e compara-la com o valor crftico de F apresentado nas tabelas F 
ao nivel de significancia escolhido ou obter o valor p da estatfstica F calculada. 

Para il ustra r, vamos continuar com nosso exemplo. ATabela 5.4 apresenta a tabela ANOVApara 
este exemplo. O valor de F calculado e de 108,3026. O valor p dessa estatfstica F correspondente a 
1 e 11 graus de liberdade nao pode ser encontrado na tabela F do Apendice D, mas, usando tabelas 
estatisticas eletronicas, verificamos que o valor p e 0,0000001, de fato, uma probabilidade extrema- 
mente baixa. Se voce optar pela abordagem do nivel de significancia para o teste de hipoteses e fixar 
a em 0,01, ou um rn'vel de 1%, vera que o valor F calculado de 108,3026 e obviamente significativo 
nesse nfvel. Portanto, se rejeitarmos a hipotese nula de que fi 2 = 0, a probabilidade de cometer um 
erro do Tipo I sera muito pequena. Para todos os fins praticos, nossa amostra nao poderia ser prove- 
niente de uma populagao com um valor de fi 2 igual a zero e podemos concluir com grande confianga 
que X, a escolaridade, afeta Y o salario medio. 

Consulte o Teorema 5.7 do Apendice 5A.1 que informa que o quadrado do valor t com k graus de 
liberdade corresponde a um valor F com 1 grau de liberdade no numerador e k graus de liberdade no 
denominador. Para nosso exemplo, se supormos que H 0 : f J > 2 — 0, podemos verificar facilmente pela 
Equagao (5.3.2) que o valor estimado de t e 10,41. Esse valor 1 tem 11 graus de liberdade. Sob a mes- 
ma hipotese nula, o valor de F era 108,3026, com 1 e 11 graus de liberdade. Portanto, (10,3428) 2 = 
valor F, salvo erros de arredondamento. 

Assim, os testes tsF oferecem duas formas alternativas, mas complementares, de testar a hipotese 
nula de que /f 2 = 0. Sendo esse o caso, por que nao nos basearmos apenas no teste 1 e deixarmos de 
lado o teste Fea analise de variancia que o acompanha? Para o modelo com duas variaveis nao ha 
realmente necessidade de recorrermos ao teste F, mas quando tratarmos do tema regressoes multi- 
plas, veremos que o teste F tem varias aplicagoes interessantes que o tornam muito util e poderoso 
para verificar hipoteses estatisticas. 


5.10 Aplica^ao da analise de regressao: o problema da previsao 

Com base nos dados amostrais da Tabela 3.2, obtivemos a seguinte regressao amostral: 


Y{ = -0,0144 + 0,7240A ; 


( 3 . 6 . 1 ) 
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em que Y, e o estimador da verdadeira E( Y-) correspondente a X. Que usos podemos dar a essa re¬ 
gressao historica? Um deles seria “prever” ou “projetar” os futuros salarios medios Y correspon- 
dentes a algum nlvel de escolaridade X. Ha dois tipos de previsao: (1) previsao do valor medio 
condicional de Y correspondente a um X selecionado, por exemplo, X 0 , que e o proprio ponto da linha 
de regressao da popula£ao (veja a Figura 2.2); e (2) previsao de um valor individual de Y correspon¬ 
dente a X 0 . Chamaremos essas duas previsoes de previsao media e previsao individual. 

Previsao media 19 

Para consolidarmos essas ideias, suponhamos que X 0 = 20 c que desejamos prever E(Y \ X 0 = 20). 
Pode-se mostrar que a regressao historica (3.6.1) proporciona a estimativa pontual dessa previsao 
media do seguinte modo: 

Yq — fi\ + PiXq 

= -0,0144 + 0,7240(20) (5.10.1) 

= 14,4656 

em que Y 0 — estimador de E( Y \ X 0 ). E posslvel demonstrar que esse previsor pontual e um melhor 
estimador linear nao viesado (ou nao tendencioso): MELNT ou, do ingles, BLUE. 

Como F 0 e um estimador, e posslvel que seja diferente de seu verdadeiro valor. A diferen§a entre 
os dois valores dara alguma ideia sobre o erro de previsao ou proje 5 ao. Para avalia-lo, precisamos 
verificar a distribuipao amostral de Y 0 . Na Se 5 ao 5A.4 do Apendice 5A, mostramos que Y 0 na Equa- 
?ao (5.10.1) tem distribu^ao normal com media (/), + fi 2 X Q ) e variancia dada pela seguinte for¬ 
mula: 


(Uo) 



+ 


(^o - ^) 2 


(5.10.2) 


Substituindo o a 1 desconhecido por seu estimador nao viesado a 1 , vemos que a variavel 


Yp - (J3 1 + jB 2 X q) 

ep( Yq) 


(5.10.5) 


segue a distribu^ao t com n — 2 graus de liberdade. Portanto, a distribuigao t pode ser utilizada 
para obter intervalos de confianfa para a verdadeira E( Y {] \ X t) ) e testar hipoteses da maneira habi¬ 
tual, a saber: 


Pr[/3i+ft*o — t a /2 e P(?o) < f3\ + PiXq < Pi + P2X0 + t a / 2 e P(Uo)] — l — a (5.10.4) 


em que o erro padrao de (Y f) ) e obtido por meio de (5.10.2). 
Para nossos dados (veja a Tabela 3.2), 


var (Yq) — 0,8936 



( 20 - 12 ) 2 " 
182 


= 0,3826 


e 

ep(7 0 ) = 0,6185 


19 


Para a demonstragao das varias afirma0es feitas, veja a Segao 5A.4 do Apendice 5A. 
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FIGURA 5.6 

Intervalos de 
confianpa (bandas) 
para Y medio e para 
valores individuals 
de Y. 


Y 



X 


Portanto, o intervalo de confianpa com 95% de probabilidade da verdadeira E(Y | X 0 ) = 

X 0 e dado por: 

14,4656 - 2,201(0,6185) < E(Y 0 | X) = 20) < 14,4656 + 2,20(0,6185) 

isto e, 

13,1043 < E(Y | X — 20) < 15,8260 (5.10.5) 

Assim, dado X 0 = 20, em amostras repetidas, 95 de cada 100 intervalos como a Equaijao (5.10.5) 
incluirao o verdadeiro valor medio; a melhor estimativa individual do verdadeiro valor medio e, obvia- 
mente, a estimativa pontual 14,4656. 

Se obtivermos intervalos de confianpa de 95% como a Equapao (5.10.5) para cada um dos valores 
de X dados na Tabela 3.2, obteremos o que e conhecido como o intervalo de confianpa ou banda de 
confianpa, para a funpao de regressao da populapao da Figura 5.6. 

Previsao individual 

Se estivermos interessados em prever um valor individual de Y,Y 0 , correspondente a um valor de 
X, por exemplo, X 0 , entao, como mostra a Sepao 5 A.3 do Apendice 5A, o melhor estimador linear nao 
viesado de y 0 tambem sera dado por (5.10.1), mas sua variancia sera a seguinte: 


var(7 0 - Yo) = E[Y a - Y 0 ] 2 = a 2 


1 

1 + - + 
n 


(Xo - X) 1 

Ex , 2 


(5.10.6) 


E possivel demonstrar ainda que Y {) tambem segue a distribuipao normal com media e variancia 
dadas pelas Equapoes (5.10.1) e (5.10.6), respectivamente. Substituindo a 2 pelo desconhecido a 2 , 
temos: 

t = Y 0 -Y Q 

~ e P (y 0 - no 
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que tambem segue a distribuigao t. Desse modo, a distribuigao t pode ser usada para fazer infe- 
rencias sobre o verdadeiro Y 0 . Continuando com nosso exemplo, vemos que a previsao pontual de 
Y 0 e 14,4656, a mesma de Yq, e sua variancia e de 1,2357 (o leitor deve verificar este calculo). 
Portanto, o intervalo de confianga de 95% para Y Q correspondente al 0 = 100 e: 

(12,0190 < Y 0 | X 0 = 20 < 16,9122) (5.10.7) 

Comparando esse intervalo com a Equagao (5.10.5), vemos que o intervalo de confianga para 
o Y 0 individual e mais amplo que aquele para o valor medio de Y 0 . (Por que?) Calculando interva- 
los de confianga como a Equagao (5.10.7) condicionais aos valores de X da Tabela 3.2, obtemos a 
banda de confianga de 95% para os valores individuals de Y correspondentes a esses valores de 
X. Essa banda de confianga, juntamente com aquela para associada aos mesmos X estao na Fi- 
gura 5.6. 

No_te um aspecto importante das bandas de confianga da Figura 5.6: sua largura e menor quando 
X Q — A'_(Por que?) Contudo, a largura da banda amplia-se significativamente a medida que X 0 afasta- 
-se de X. (Por que?) Essa mudanga sugere que a capacidade de previsao da linha de regressao amos- 
tral historica cai acentuadamente a medida que X 0 afasta-se progressivamente de X. Portanto, e 
preciso ter grande cautela ao “extrapolar” a linha de regressao historica para prever E(Y IX 0 ) 
ou Y 0 associado a um dado Z 0 que esteja muito afastado da media amostral. 


5.11 A apresenta^ao dos resultados da analise de regressao 

Ha varias maneiras de apresentarmos os resultados da analise de regressao, mas neste livro usare- 
mos o formato a seguir, empregando o exemplo salarios-escolaridade do Capftulo 3 para ilustrar. 

Yj = -0,0144 + 0,7240Z ; 

ep= (0,9317) (0,0700) 

t = (-0,0154) (10,3428) 

p = (0,987) (0,000) 

Na Equagao (5.11.1), os numeros do primeiro conjunto de parenteses sao os erros padrao estima- 
dos dos coeficientes de regressao; os do segundo conjunto sao os valores t estimados, calculados por 
meio de (5.3.2) sob a hipotese nula de que o verdadeiro valor populacional de cada coeficiente de 
regressao individual e zero (por exemplo, 10,3428 = q^qq ); e os numeros do terceiro conjunto sao 
os valores p estimados. Com 11 graus de liberdade, a probabilidade de obter um valor t de 10,3428 
ou mais e de praticamente zero. Alem disso, para 11 graus de liberdade a probabilidade de obter 
um valor t de 10,3428 ou mais e 0,00009, o que e praticamente nula. Lembre-se de que quanto menor 
o valor p, menor a probabilidade de cometer um erro se rejeitarmos a hipotese nula. 

Apresentando os valores p para os coeficientes estimados t percebemos de imediato o nlvel de 
importancia de cada valor t estimado. Alem disso, sob a hipotese nula que o verdadeiro valor da 
curva populacional e zero, a probabilidade exata de obter um valor de t igual ou maior de 10,3428 
e praticamente zero. 

Mostramos anteriormente a estreita relagao entre as estatlsticas F e t, especificamente, F l k — t L 2 . 
Sob a hipotese nula de que o verdadeiro — 0, a Equagao (5.11.1) mostra que o valor F e de 108,30 
(para 1 grau de liberdade no numerador e 11 no denominador) e o valor t e cerca de 10,34 (11 gl); 
conforme esperado, o primeiro valor e o quadrado do segundo valor, exceto pelos erros de arredon- 
damento. A tabela ANOVA para esse problema ja foi discutida. 


r 2 = 0,9065 
gl = 11 
F U1 = 108,30 


(5.11.1) 
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5.12 Avaliando os resultados da analise de regressao 


Na Figura 1.4 da Introdugao, tragamos a anatomia da modelagem econometrica. Agora que 
apresentamos os resultados da analise de regressao do exemplo salarios-escolaridade na Equagao 
(5.11.1), gostariamos de questionar a adequagao do modelo ajustado. Qual a “qualidade” dele? 
Precisamos de alguns criterios para responder a essa pergunta. 

Primeiro, os sinais dos coeficientes estimados estao de acordo com as expectativas teoricas ou os 
resultados de estudos anteriores? A priori, /C, no exemplo salarios-escolaridade, deveria ser positivo. 
No caso, e. Segundo, se a teoria diz que a relag ao deve ser nao apenas positiva, mas tambem estatis- 
ticamente significante, isso ocorre nessa aplicagao? Como discutimos na Segao 5.11,o coeficiente de 
escolaridade nao so e positivo como tambem difere significativamente de zero em termos estatisticos; 
o valor p do valor t estimado e extremamente pequeno. Os mesmos comentarios aplicam-se ao coefi¬ 
ciente do intercepto. Terceiro, ate que ponto o modelo de regressao explica as variagdes no nosso 
exemplo? Podemos usar r 1 para responder a essa pergunta. Neste exemplo, r 2 e cerca de 0,90, o que 
e um valor muito alto, considerando-se que r 2 pode chegar, no maximo, a 1. 

O modelo que escolhemos para explicar os salarios medios parece bastante bom. Mas antes de 
passarmos a outro topico, gostariamos de verificar se o modelo satisfaz as hipoteses do modelo 
classico de regressao linear normal. Nao examinaremos agora as varias hipoteses, porque o mo¬ 
delo e extremamente simples. Contudo, ha uma hipotese que merece ser verificada: a normalidade 
do termo de erro Lembre-se de que os testes t e F usados anteriormente exigem que o termo de 
erro siga uma distribuigao normal. Caso contrario, o procedimento de teste nao sera valido para 
amostras pequenas ou finitas. 

Testes de normalidade 

Embora a literatura especifica examine varios testes de normalidade, consideraremos apenas de 
tres: (1) histograma de residuos; (2) representapao de probabilidade normal, um artificio grafico; e (3) 
o teste Jarque-Bera. 

Histograma de residuos 

O histograma de residuos e um dispositivo grafico simples usado para conhecer algo sobre a for¬ 
ma da funcao de densidade de probabilidade (FDP) de uma variavel aleatoria. No eixo horizontal, 
dividimos os valores da variavel de interesse (no caso, os residuos de MQO) em intervalos adequados 
e, em cada intervalo de classe, tra^amos retangulos com altura correspondente ao numero de observa- 
5 oes (sua frequencia) nesse intervalo de classe. Sobrepondo mentalmente a curva em forma de sino da 
distribuigao normal ao histograma, voce podera ver se a aproximagao normal (FDP) e adequada. A 
Figura 5.7 mostra o histograma de residuos para a regressao salarios-escolaridade. 


FIGURA 5.7 

Histograma de 
residuos da regressao 
salarios-escolaridade. 
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Esse diagrama indica que os resfduos nao tem uma distribuigao normal perfeita; para uma varia- 
vel normalmente distribufda, a assimetria (uma medida de simetria) deve ser zero e a curtose (que 
mede quao alta ou atarracada e a distribuigao normal) deve ser 3. 

Mas e sempre uma boa pratica tragar o histograma dos resfduos de qualquer regressao como um 
metodo rustico e rapido de testar a premissa de normalidade. 

Grafico de probabilidade normal 

Um artificio grafico comparativamente simples para estudar a forma da fungao de densidade de 
probabilidade de uma variavel aleatoria e o grafico de probabilidade normal (GPN), em que usa- 
mos o papel de probabilidade normal, um papel especial para graficos. No eixo horizontal, ou dos X, 
marcamos os valores da variavel de interesse (no caso, os residuos de MQO, it,-) e no eixo vertical, ou 
dos Y, representamos o valor esperado para essa variavel caso estivesse normalmente distribufda. Se 
a variavel provem de fato de uma populagao normal, o GPN sera aproximadamente uma linha reta. 
A Figura 5.8 mostra um grafico desse tipo para nossa regressao salarios-escolaridade, elaborada 
com o software MINITAB, versao 15. Como observado, se a linha ajustada do GPN for aproximada¬ 
mente uma reta, podemos concluir que a variavel esta normalmente distribufda. Na Figura 5.8, vemos 
que os resfduos de nosso exemplo apresentam uma distribuigao aproximadamente normal, porque a 
linha reta parece ajustar-se bastante bem aos dados. 

O M1N1TAB tambem gera o teste de normalidade Anderson-Darling, conhecido como estatistica 
A 2 . A hipotese nula subjacente e que a variavel considerada e em geral distribufda. De acordo com a Fi¬ 
gura 5.8, para nosso exemplo, a estatistica A 2 calculada e 0,289. O valor p da obtengao desse valor de A 2 
e 0,558, que e razoavelmente alto. Portanto, nao rejeitamos a hipotese de que os resfduos da regressao de 
nosso exemplo distribuem-se normalmente. De maneira casual, a Figura 5.8 mostra os parametros da 
distribuigao (normal), a media de aproximadamente 0 e o desvio padrao de cerca de 0,8987. 

Teste de normalidade Jarque-Bera ( JB ). 20 

O teste de normalidade JB e um teste assintotico ou de amostra grande. Tambem se baseia nos resf¬ 
duos de MQO. Ele calcula, primeiro, a assimetria e a curtose (examinadas no Apendice A) dos 
residuos de MQO e usa o seguinte teste estatistico: 



(5.12.1) 


FIGURA 5.8 

Resfduos da 
regressao salarios- 
escolaridade. 
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Veja JARQUE, C. M.; BERA, A. K. "A test for normality of observations and regression residuals." International 
Statistical Review, 1987. v. 55, p. 163-172. 
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em que n — tamanho da amostra, S — coeficiente de assimetria e K — coeficiente de curtose. Para uma 
variavel normalmente distribufda, S = 0 e K — 3. Portanto, o teste JB de normalidade e um teste da 
hipotese conjunta de que S e K sao iguais a 0 e 3, respectivamente. Nesse caso, espera-se que o valor 
da estatistica JB seja igual a 0. 

Sob a hipotese nula de que os resfduos sao normalmente distribufdos, Jarque e Bera demonstra- 
ram que, assintoticamente (isto e, em amostras grandes), a estatistica JB dada na Equagao ( 5.12.1) 
segue a distribuigao de qui-quadrado com 2 graus de liberdade. Se o valor p calculado para a esta¬ 
tistica JB em uma aplicagao for suficientemente baixo, o que acontece quando o valor da estatistica e 
muito diferente de zero, podemos rejeitar a hipotese de que a distribuigao dos resfduos e normal. Mas 
se o valor p for razoavelmente alto, o que acontece quando o valor da estatistica esta proximo de zero, 
nao rejeitaremos a hipotese de normalidade. 

A estatistica JB estimada para nosso exemplo salarios-escolaridade e de 0,8286. A hipotese nula 
de que os resfduos neste exemplo estao normalmente distribufdos nao pode ser rejeitada, pois o valor 
p de obtermos uma estatistica JB de 0,8286 ou maior e de cerca de 0,66% ou 66%. Essa probabilida- 
de e bastante alta. Note que embora nossa regressao tenha 13 observagoes, elas foram obtidas de uma 
amostra de 528 observagoes, o que parece razoavelmente alto. 

Outros testes da adequagdo do modelo 

Lembre-se de que o modelo classico de regressao linear normal estabelece muito mais hipoteses 
alem da normalidade do termo de erro (ou termo de disturbio). A medida que avangarmos no exame 
da teoria econometrica, veremos varios testes da adequagao do modelo (veja o Capftulo 13). Ate la, 
tenha em mente que a formulagao de modelos de regressao baseia-se em varias hipoteses simplifica- 
doras que podem nao se sustentar em cada caso especifico. 


Um exemplo 
final 


Voltemos ao Exemplo 3.2 sobre despesas com alimentos na India. Usando os dados for- 
necidos na Equagao (3.7.2) e adotando o formato da Equagao (5.11.1), obtemos a seguinte 
equagao de despesas: 


DespAlimentagao ,= 94,2087 + 


ep = (50,8563) 
t= (1,8524) 
p= (0,0695) 
r 2 = 0,3698; 

fi.53 = 31,1034 


0,4368 TotalExp, 
(0,0783) 

(5,5770) 

(0,0000)* 
gl = 53 

(valor p = 0,0000)* 


( 5 . 12 . 2 ) 


em que "*" denota extremamente pequeno. 

Primeiro, vamos interpretar a regressao. Como esperado, existe uma relagao positiva en- 
tre despesas com alimentos e despesa total. Se a despesa total aumentar em uma rupia, em 
media, a despesa com alimentagao aumentara em cerca de 44 pafses. Se a despesa total for 
zero, em media a despesa com alimentagao sera de 94 rupias. Obviamente, essa interpreta- 
gao mecanica do intercepto pode nao fazer muito sentido economico. O valor de r 2 , cerca de 
0,37, significa que 37% da variagao na despesa com alimentos e explicada pela despesa total, 
uma proxy para a renda. 

Suponha que queiramos testar a hipotese nula de que nao ha relagao entre despesa com 
alimentagao e despesa total, que o coeficiente angular verdadeiro f$ 2 = 0. O valor estimado 
de p 2 e 0,4368. Se a hipotese nula fosse verdadeira, qual seria a probabilidade de obter um 
valor de 0,4368? Sob a hipotese nula, observamos na Equagao (5.12.2) que o valor t e 
5,5770 e o valor p de obter esse valor t e praticamente igual a zero. Em outras palavras, po¬ 
demos rejeitar totalmente a hipotese nula. Mas suponha que a hipotese nula seja /3 2 = 0,5. E 
agora? Recorrendo ao teste t, obtemos: 


0.4368- 0,5 
0,0783 


0,8071 


( Continua ) 
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Um exemplo 
final 

(' Continuagdo ) 


FIGURA 5.9 

Resfduos da 
regressao das 
despesas com 
alimentagao. 


A probabilidade de obter um |t| de 0,8071 e de mais de 20%. Portanto, nao rejeitamos a 
hipotese de que o verdadeiro f$ 2 seja 0,5. 

Note que, sob a hipotese nula, o coeficiente angular verdadeiro e zero, o valor Fe 31,1034, 
como mostra a Equagao (5.12.2). Sob a mesma hipotese nula, obtivemos um valor t de 
5,5770. Se elevarmos ao quadrado esse valor, obteremos 31,1029 que e quase o mesmo 
valor de F, mostrando novamente a estreita relagao entre as estatfsticas t e F. ( Nota: o gl no 
numerador da estatfstica Fdeve ser 1, como ocorre neste caso.) 

Usando os resfduos estimados da regressao, o que podemos dizer sobre a distribuigao de 
probabilidade do termo de erro? Essa informagao esta na Figura 5.9. Como a Figura 5.9 indi- 
ca, os resfduos da regressao da despesa com alimentos parecem ter uma distribuigao simetrica. 
A aplicagao do teste Jarque-Bera mostra que a estatfstica JB e de cerca de 0,2576, e que a 
probabilidade de obter esse numero, sob uma premissa de distribuigao normal, e de cerca de 
88%. Portanto, nao rejeitamos a hipotese de que os termos de erro se distribuam normal- 
mente. Mas tenha em mente que o tamanho da amostra de 55 observances pode nao ser 
suficientemente grande. 



Series: resfduos 


Amostra 1 55 


Observa^oes 55 


Media 

-l,19xl(T 14 

Mediana 

7,747849 

Maximo 

171,5859 

Mfnimo 

-153,7664 

Desvio padrao 

66,23382 

Assimetria 

0,119816 

Curtose 

3,234473 

Jarque-Bera 

0,257585 

Probabilidade 

0,879156 


Deixamos para o leitor a tarefa de estabelecer intervalos de confianga para os dois coefi- 
cientes de regressao, assim como a de representar graficamente a probabilidade normal e 
fazer previsoes para a media e individual. 


Resumo e 
conclusoes 


1. A estimagao e o teste de hipoteses sao os dois ramos principais da estatfstica classica. Depois de 
discutirmos o problema da estimagao nos Capftulos 3 e 4, dedicamos este capftulo ao problema 
do teste de hipoteses. 

2. O teste de hipoteses responde a seguinte pergunta: um resultado obtido e compativel com a hipo¬ 
tese feita ou nao? 

3. Ha duas abordagens mutuamente complementares para a resposta a pergunta feita: o intervalo de 
confianga e o teste de significance. 

4. Por tras da abordagem do intervalo de confianga esta o conceito da estimagao de intervalo. Um 
estimador de intervalo e um intervalo ou faixa elaborada de tal modo que tenha uma probabili¬ 
dade especifica de incluir entre seus limites o verdadeiro valor de um parametro desconhecido. O 
intervalo assim construfdo e conhecido como intervalo de eonfianga, que muitas vezes e apre- 
sentado em forma de porcentagem, como 90% ou 95%. O intervalo de confianga oferece um 
conjunto de hipoteses plausfveis sobre o valor do parametro desconhecido. Se o valor proposto na 
hipotese nula estiver dentro do intervalo de confianga, a hipotese nao sera rejeitada; se estiver fora 
do intervalo, a hipotese nula podera ser rejeitada. 
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EXERCICIOS 


5. No procedimento do teste de significancia, desenvolvemos um teste estatistico e examinamos 
sua distribuifao amostral sob a hipotese nula. Os testes estatisticos costumam seguir uma dis- 
tribuifao de probabilidade bem definida, como a normal, a t, a F ou a qui-quadrado. Uma vez 
calculado o teste estatistico (por exemplo, a estatfstica 1) com base nos dados disponfveis, seu 
valor p pode ser facilmente obtido. O valor p fornece a probabilidade exata de obter o teste estatfs- 
tico calculado sob a hipotese nula. Se esse valor p for pequeno, podemos rejeitar a hipotese nula, 
mas, se for grande, talvez nao seja possivel rejeita-la. Cabe ao pesquisador definir o que constitui 
um p grande ou pequeno. Ao escolher o valor p, o pesquisador deve ter em mente as probabili- 
dades de cometer os erros do Tipo I ou do Tipo II. 

6. Na pratica, e preciso ter cuidado ao fixar a, a probabilidade de cometer um erro do Tipo I, em 
valores arbitrarios como 1%, 5% ou 10%. E melhor recorrer ao valor p do teste estatistico. Alem 
disso, a significancia estatistica de um indicador nao deve ser confundida com sua significancia 
pratica. 

7. Obviamente, o teste de hipoteses presume que o modelo escolhido para a analise empirica seja 
adequado no sentido de que nao desrespeite uma ou mais das hipoteses que embasam o modelo 
classico de regressao linear normal. Os testes da adequa?ao do modelo devem preceder o teste de 
hipoteses. Este capftulo apresentou um desses testes, o teste de normalidade, para verificar se o 
termo de erro segue a distribuifao normal. Como em amostras pequenas, ou finitas, os testes t, F 
e qui-quadrado requerem a hipotese de normalidade, e importante que essa hipotese seja testada 
formalmente. 

8. Se o modelo e considerado praticamente adequado, pode ser usado para fins de previsao. Mas, ao 
prever os valores futuros do regressando, e preciso nao se afastar demais da faixa de valores do 
regressor. Caso contrario, os erros de previsao podem aumentar de modo impressionante. 


5.1. Verifique, explicando, se as seguintes afirma 9 oes sao verdadeiras, falsas ou duvidosas. Seja 

preciso. 

a. O teste t de significancia discutido neste capitulo requer que as distributes amostrais dos 
estimadores fi\ e /> 2 sigam a distribu^ao normal. 

b. Mesmo que o termo de erro do modelo classico de regressao linear nao seja normalmen- 
te distribuido, os estimadores de mmimos quadrados ordinarios continuam sendo nao 
viesados. 

c. Se nao ha intercepto no modelo de regressao, a soma dos m, estimados (= up nao totalizara 
zero. 

d. O valor p e o tamanho de um teste estatistico significant a mesma coisa. 

e. Em um modelo de regressao que content o intercepto, a soma dos residuos e sempre igual 
a zero. 

f. Se uma hipotese nula nao e rejeitada, ela e verdadeira. 

g. Quanto mais alto o valor de a 2 , maior a variancia de fi 2 dada na Equayao (3.3.1). 

li. As medias condicional e nao condicional de uma variavel aleatoria sao a mesma coisa. 

i. Na FRP de duas variaveis, se o coeficiente angular /f 2 e zero, o intercepto e estimado pela 
media amostral Y. 

j. A variancia condicional, var ( Y l I X,) — a * 1 e a variancia nao condicional de Y, var (K) = cry, 
serao iguais se X nao influenciar Y. 

5.2. Monte uma tabela ANOVA semelhante a Tabela 5.4 para o modelo de regressao da Equac^ao 

(3.7.2) e teste a hipotese de que na India nao ha relactao entre a despesa com alimentos e a 

despesa total. 

5.3. Consulte a regressao da demanda por telefones celulares na Equacao (3.7.3). 
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a. O coeficiente de intercepto estimado e significative no nivel de 5% de significance? Qual 
e a hipotese nula subjacente? 

b. O coeficiente angular estimado e significativo no nivel de 5% de significance? Qual a hi¬ 
potese nula subjacente? 

c. Estabelepa uma confianpa de 95% para o verdadeiro coeficiente angular. 

d. Qual o valor medio estimado para a demanda de telefones celulares se a renda per capita 
for de $ 9.000? Qual o intervalo de confianpa de 95% para o valor previsto? 

Seja p 1 o verdadeiro coeficiente de determinapao populacional. Suponha que voce queira testar 
a hipotese p 1 — 0. Explique verbalmente como seria possrvel testar essa hipotese. Dica: use 
a Equapao (3.5.11). Veja tambem o Exercicio 5.7. 

O que se conhece por linha caracteristica na analise moderna de investimentos nada mais e 
do que a regressao obtida por meio do seguinte modelo: 

r it = oti + Pir mt + u t 

em que r jt — taxa de retorno do /-esimo ativo no perfodo t 

r mt = taxa de retorno do portfolio de mere ado no perfodo t 
iij = termo de erro estocastico 

Neste modelo, /3 ; e conhecido como o coeficiente beta do /-esimo ativo, uma medida do risco 
de mercado (ou risco sistemico) de um ativo. 

Com base em 240 taxas de retorno mensais do perfodo 1956-1976, Fogler e Ganapathy obti- 
veram a seguinte linha caracteristica para as apoes da IBM em relapao ao indice de portfolio 
de mercado calculado pela Universidade de Chicago: 1 

r it = 0,7264+ l,0598r m? r 2 = 0,4710 

ep = (0,3001) (0,0728) gl = 238 

F 1.238 = 211,8 96 

a. Diz-se que um ativo cujo coeficiente beta e maior que um e um papel volatil ou agressivo. 
As apoes da IBM foram volateis durante o perfodo estudado? 

b. O coeficiente do intercepto e significativamente diferente de zero? Se for, qual o significa- 
do pratico disso? 

5.6. A Equapao (5.3.5) tambem pode ser escrita como: 

Pr [fa ~ t a/ 2 ep(^ 2 ) < Pi < Pi + 4/2 e P(^ 2 )] = 1 - a 

Em outras palavras, a desigualdade fraca (<) pode ser substituida pela desigualdade forte (<). 
Por que? 

5.7. R. A. Fisher derivou a distribuipao amostral do coeficiente de correlapao definido na Equapao 
(3.5.13). Se supusermos que as variaveis Xe Y nao apresentam uma distribuipao normal conjun- 
ta, isto e, elas provem de distribuipao normal bivariada (veja o Apendice 4A, Exercicio 4.1), en- 
tao, sob a hipotese de que o coeficiente de correlapao populacional p e zero, pode-se demonstrar 
que t = r V n - 2/x/l - r 2 segue a distribuipao t de Student com n — 2 graus de liberdade? 
Mostre que esse valor de t e identico ao valor t da Equapao (5.3.2) sob a hipotese nula de que 
yS 2 = 0. Entao, estabelepa que, sob a mesma hipotese nula, F— t 1 . (Veja a Sepao 5.9.) 


Veja LEVY, Haim; SARNAT, Marshall. Portfolio and investment Selection: theory and practice. Englewood Cliffs, N. 
J.: Prentice-Hall International, 1984. cap. 12. 

t FOGLER, H. Russell; GANAPATHY, Sundaram. Financial econometrics. Englewood Cliffs, N. J.: Prentice-Hall In¬ 
ternational, 1982. p. 13. 

* Se p for, de fato, zero, Fisher mostrou que r seguira a mesma distribuipao t, contanto que X ou Y seja normal- 
mente distribufdo. Mas, se p nao for igual a zero, as duas variaveis deverao ser normalmente distribufdas. Veja 
ANDERSON, R. L.; BRANCROFT, T. A. Statistical theory in research. Nova York: McGraw-Hill, 1952. p. 87-88. 


5.4. 

5.5. 
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5.8. Considere os seguintes resultados de uma regressao: 

% = 0,2033 + 0,6560X r 
ep= (0,0976) (0,1961) 

r 2 = 0,397 SQR= 0,0544 SQE= 0,0358 

em que Y — taxa de participagao das mulheres na fore:a de trabalho em 1972 e X = taxa de 
participagao das mulheres na forga de trabalho em 1968. A regressao foi feita com uma amos- 
tra de 19 cidades americanas. 

a. Como voce interpreta esta regressao? 

b. Teste as hipoteses H 0 : /) 2 = I e //,: /T > 1. Qual teste voce usa? Por que? Quais sao as pre- 
missas que embasam o(s) teste(s) usado(s)? 

c. Suponha que a taxa de participagao das mulheres na forga de trabalho em 1968 tenha sido 
de 0,58 (ou 58%). Com base nos resultados da regressao anterior, qual a taxa media de 
participagao das mulheres em 1972? Adote um intervalo de confianga de 95% para prever 
a media. 

d. Como voce testaria a hipotese de que o termo de erro na regressao da populagao se distribui 
normalmente? Mostre os calculos necessarios. 

Exercicios aplicados 

5.9. A Tabela 5.5 apresenta dados sobre a remuneragao anual (salario medio em dolares) dos pro- 
fessores e as despesas por aluno das escolas (em dolares) no ano de 1985 em 50 Estados e no 
distrito de Columbia. 


TABELA 5.5 

Observagao 

Salario 

Despesa 

Observagao 

Salario 

Despesa 

Salario medio anual 

1 

19.583 

3346 

27 

22.795 

3366 

dos professores e 
despesa media por 

2 

20.263 

3114 

28 

21.570 

2920 

3 

20.325 

3554 

29 

22.080 

2980 

aluno (em dolares), 

1985 

4 

26.800 

4642 

30 

22.250 

3731 

5 

29.470 

4669 

31 

20.940 

2853 

Fonte: National Education 

6 

26.610 

4888 

32 

21.800 

2533 

Association, citado em 

7 

30.678 

5710 

33 

22.934 

2729 

reportagem do Albuquerque 
Tribune, 7 nov. 1986. 

8 

27.170 

5536 

34 

18.443 

2305 


9 

25.853 

4168 

35 

19.538 

2642 


10 

24.500 

3547 

36 

20.460 

3124 


11 

24.274 

3159 

37 

21.419 

2752 


12 

27.170 

3621 

38 

25.160 

3429 


13 

30.168 

3782 

39 

22.482 

3947 


14 

26.525 

4247 

40 

20.969 

2509 


15 

27.360 

3982 

41 

27.224 

5440 


16 

21.690 

3568 

42 

25.892 

4042 


17 

21.974 

3155 

43 

22.644 

3402 


18 

20.816 

3059 

44 

24.640 

2829 


19 

18.095 

2967 

45 

22.341 

2297 


20 

20.939 

3285 

46 

25.610 

2932 


21 

22.644 

3914 

47 

26.015 

3705 


22 

24.624 

4517 

48 

25.788 

4123 


23 

27.186 

4349 

49 

29.132 

3608 


24 

33.990 

5020 

50 

41.480 

8349 


25 

23.382 

3594 

51 

25.845 

3766 


26 

20.627 

2821 





Adaptado de CHATTERJEE, Samprit; HADI, AN S.; PRICE, Bertram. Regression analysis by example. 3. ed. Nova 
York: Wiley Interscience, 2000. p. 46-47. 
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Parte Um 


Modelos de regressao com equafao unica 


Para verificar se ha alguma relapao entre a remunerapao dos professores e as despesas por 
aluno nas escolas publicas, sugeriu-se o seguinte modelo: Rem, = + /3 2 Gast, + u h em que 

Rem representa o salario dos professores e Gast, as despesas por aluno. 

a. Represente graficamente os dados e trace uma linha de regressao a olho. 

b. Suponha que, com base em (a), voce decida estimar o modelo de regressao anterior. Obte- 
nha as estimativas dos parametros, os erros padrao, r 2 , SQR e SQE. 

c. Interprete os resultados da regressao. Faz sentido do ponto de vista economico? 

d. Estabelepa um intervalo de confianpa de 95% para /3 2 .Voce rejeitaria a hipotese de que o 
verdadeiro coeficiente angular e 3,0? 

e. Obtenha a media e o valor individual previsto de Rem se as despesas por aluno forem de 
$ 5.000. Estabelepa tambem intervalos de confianpa para a media real e para o valor indi¬ 
vidual de Rem para a despesa dada. 

/. Como voce testaria a hipotese de normalidade do termo de erro? Mostre o(s) teste(s) que 
usou. 

5.10. Consulte os dados do Exercicio 3.20 e monte as tabelas ANOVA e teste a hipotese de que nao 
ha relapao entre produtividade e salario real. Fapa isso para o setor empresarial e para o empre- 
sarial nao agricolas. 

5.11. Volte ao Exercicio 1.7. 

a. Trace um grafico dos dados com as impressoes no eixo vertical e as despesas com publici- 
dade no horizontal. Que tipo de relapao voce observa? 

b. Seria apropriado ajustar um modelo de regressao linear bivariada a esses dados? Justifique 
sua resposta. Em caso negativo, que tipo de modelo voce usaria para ajustar os dados? Temos 
as ferramentas necessarias para faze-lo? 

c. Suponha que voce nao tenha representado graficamente os dados e apenas os ajuste a um 
modelo de regressao bivariada. Obtenha os resultados costumeiros. Guarde os resultados 
para voltar mais adiante a este problema. 

5.12. Volte ao Exercicio 1.1. 

a. Trace um grafico com os dados do Indice de Prepos ao Consumidor (IPC) dos Estados 
Unidos em um eixo e os do IPC canadense no outro. O que o grafico mostra? 

b. Suponha que voce queira prever o IPC dos Estados Unidos com base no IPC do Canada. 
Desenvolva um modelo adequado. 

c. Teste a hipotese de que nao ha relapao entre os IPCs dos dois paises. Use a = 5%. Se voce 
rejeitar a hipotese nula, isso significa que o IPC canadense “causa” o IPC dos Estados Uni¬ 
dos? Justifique sua resposta. 

5.13. Volte ao Exercicio 3.22. 

a. Estime as duas regressoes dadas la, calculando os erros padrao e os demais resultados ha- 
bituais. 

b. Teste a hipotese de que os termos de erro dos dois modelos de regressao distribuem-se 
normalmente. 

c. Na regressao do preco do ouro, teste a hipotese de que fi 2 = 1, ou seja, de que ha uma rela¬ 
pao de um para um entre os prepos do ouro e o IPC (o ouro e um hedge perfeito). Qual o 
valor p da estatfstica 1 estimada? 

d. Repita o item (c), agora com a regressao do mdice NYSE. O investimento no mercado de 
a 5 oes e um hedge perfeito contra a inflapao? Que hipotese nula voce esta testando? Qual 
seu valor pi 

e. Entre o ouro e as apoes, qual investimento voce escolheria? Em que se baseia sua deci- 
sao? 
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5.14. A Tabela 5.6 apresenta dados sobre o PNB e quatro definipoes do estoque de moeda dos Esta- 
dos Unidos no periodo 1970-1983. Fazendo as regressoes do PNB contra as varias definipoes 
de moeda, obtemos os resultados apresentados na Tabela 5.7. 

Os monetaristas ou adeptos da teoria quantitativa afirmam que a renda nominal (o PNB nomi¬ 
nal) e determinada, em grande parte, pela variagao na quantidade ou estoque de moeda, embo- 
ra nao haja consenso quanto a definigao “certa” de moeda. De acordo com os resultados na 
tabela, responda as seguintes perguntas: 

a. Que defini^ao de moeda parece apresentar rela<;ao mais estreita com o PNB nominal? 

b. Como os r 2 sao todos elevados, isso significa que a escolha da definipao de moeda nao tem 
importancia? 

c. Se o FED (Banco Central dos Estados Unidos) quer controlar a oferta de moeda, qual des¬ 
ses indicadores de moeda seria o melhor objetivo para esse fim? Isso pode ser dito com 
base nos resultados da regressao? 

5.15. Imagine que a equa£ao de uma curva de indiferen^a entre dois bens seja: 

XiYt = /Si + fhXt 


TABELA 5.6 

PNB e estoque de 
moeda segundo 
quatro conceitos 

Fonte: Economic Report of 
the President, 1985, dados 
do PNB, Quadro B-l, p. 
232; e estoque de moeda, 
Quadro B-61, p. 303. 


TABELA 5.7 

Regressoes PNB- 
Estoque de moeda, 
1970-1983 


Medida de estoque de moeda, bilhoes de $ 
PNB - 


Ano 

(bilhoes de $) 

M, 

m 2 

m 3 

L 

1970 

992,70 

216,6 

628,2 

677,5 

816,3 

1971 

1.077,6 

230,8 

712,8 

776,2 

903,1 

1972 

1.185,9 

252,0 

805,2 

886,0 

1.023,0 

1973 

1.326,4 

265,9 

861,0 

985,0 

1.141,7 

1974 

1.434,2 

277,6 

908,5 

1.070,5 

1.249,3 

1975 

1.549,2 

291,2 

1.023,3 

1.1 74,2 

1.367,9 

1976 

1.718,0 

310,4 

1.163,6 

1.311,9 

1.516,6 

1977 

1.918,3 

335,4 

1.286,7 

1.472,9 

1.704,7 

1978 

2.163,9 

363,1 

1.389,1 

1.647,1 

1.910,6 

1979 

2.41 7,8 

389,1 

1.498,5 

1.804,8 

2.117,1 

1980 

2.631,7 

414,9 

1.632,6 

1.990,0 

2.326,2 

1981 

2.957,8 

441,9 

1.796,6 

2.238,2 

2.599,8 

1982 

3.069,3 

480,5 

1.965,4 

2.462,5 

2.870,8 

1983 

3.304,8 

525,4 

2.196,3 

2.710,4 

3.183,1 

Definigao: 





Mj = Papel moeda + depositos a vista + cheques de viagem e outros depositos sacaveis por cheque. 


m 2 = m, 

+ depositos no overnight e eurodolares + fundos do mercado monetario + depositos a 



prazo fixo + contas de poupan 9 a 

. e pequenos depositos. 



M 3 = M 2 + grandes depositos a prazo fixo + depositos 

a prazo + fundos do mercado monetario institucionais. 

L = M 3 + outros ativos lfquidos. 






1) 

PNB t = 

787,4723 + 8,0863 M u 
(77,9664) (0,2197) 

r 2 = 0,9912 

2) 

PNB't = 

44,0626 + 1,5875 M zt 
(61,0134) (0,0448) 

r 2 = 0,9905 

3) 

PNB t = 

159,1366 + 1,2034 M it 
(42,9882) (0,0262) 

r 2 = 0,9943 

4) 

PNB't = 

164,2071 + 1,0290 L t 
(44,7658) (0,0234) 

r 2 = 0,9938 


Nota: os numeros entre parenteses sao os erros padrao estimados. 
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Como voce estimaria os parametros desse modelo? Aplique o modelo anterior aos dados da 
Tabela 5.8 e comente os resultados. 

5.16. Desde 1986, a revista The Economist publica o indice Big Mac, uma tentativa pouco refinada, 
mas engra 9 ada, de avaliar se as taxas de cambio das diversas moedas estao “corretas”, de acor- 
do com os preceitos da teoria da paridade do poder de compra (PPC). Essa teoria afirma que 
uma unidade monetaria deveria poder comprar a mesma cesta de produtos em todas as econo- 
mias. Seus proponentes argumentam que, a longo prazo, as moedas tendem a convergir para a 
PPC. A revista The Economist adota o Big Mac do McDonald’s como cesta de produtos repre- 
sentativa e apresenta as informa 5 oes da Tabela 5.9. 


TABELA 5.8 


Consumo do bem X: 1 2 3 4 5 

Consumo do bem Y: 4 3,5 2,8 1,9 0,8 


Considere o seguinte modelo de regressao: 

Y, = fi\ + p 2 Xi + Uj 

em que Tea taxa de cambio vigente eX = PPC implfcita do dolar. 

a. Se a PPC estiver certa, que valores de j J >\ e fi 2 voce poderia esperar a priori ? 

b. Os resultados da regressao confirmam suas expectativas? Que testes formais voce empre- 
garia para testar suas hipoteses? 

c. A revista The Economist deveria continuar divulgando o indice Big Mac? Justifique. 

5.17. Volte aos dados das provas SAT apresentados no Exercicio 2.16. Suponha que voce queira 
prever a pontua£ao dos homens nas provas de matematica (T) com base na pontua^ao das mu- 
Iheres (A), usando a seguinte regressao: 

Yt = Pi + p 2 X t + Uf 

a. Estime esse modelo. 

b. Com base nos residuos estimados, verifique se a hipotese de normalidade sustenta-se. 

c. Agora teste a hipotese de que /i 2 = 1, isto e, de que existe uma correspondencia de um para 
um entre as notas de matematica de homens e mulheres. 

d. Monte uma tabela ANOVA para este problema. 

5.18. Repita o exercicio anterior, agora com as notas de aptidao verbal. 

5.19. ATabela 5.10 apresenta os dados anuais relativos ao Indice de Preqios ao Consumidor (IPC) e 
ao Indice de Pre^o no Atacado (IPA), tambem conhecido como Indice de Precjos ao Produtor 
(IPP), para a economia americana no periodo 1980-2006. 

a. Trace um grafico com o IPC no eixo vertical e o IPP no eixo horizontal. A priori, que tipo 
de relac^ao voce espera encontrar entre os dois indices. Por que? 

b. Suponha que voce deseja prever um desses indices com base no outro. Qual deles usaria 
como regressando e qual como regressor? Por que? 

c. Estime a regressao de acordo com o estabelecido no item (/;). Mostre os resultados habituais. 
Teste a hipotese de que existe uma rela£ao de um para um entre os dois indices. 

d. Com base nos residuos obtidos na regressao calculada, e possfvel cogitar a hipotese de que 
o verdadeiro termo de erro esta normalmente distribuido? Mostre os testes usados. 

5.20. A Tabela 5.11 apresenta dados sobre o fndice de mortalidade por cancer de pulmao (100 = 
media) e o fndice de consumo de fumo (100 = media) para 25 grupos ocupacionais. 

a. trace o grafico do indice de mortalidade por cancer de pulmao em relagao ao indice de 
fumo. Que padrao geral voce observa? 
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TABELA 5.9 

0 padrao hamburguer 

Fonte: McDonald's; The 
Economist, 1 fev. 2007. 



Pre^os do Big Mac 




Super (+)ou 






sub(-) 




PPC* 

Taxa de 

valorizagao 


Em moeda 

Em 

implicita 

cambio em 

em rela^ao 


local 

dolares 

do dolar 

31-1-2007 

ao dolar 

Estados Unidos^ 

Dolar americano 3,22 

3,22 




Argentina 

Peso argentino 8,25 

2,65 

2,56 

3,11 

-18 

Australia 

Dolar australiano 3,45 

2,67 

1,07 

1,29 

-1 7 

Brasil 

Real 6,4 

3,01 

1,99 

2,13 

-6 

Gra-Bretanha 

Libra esterlina1,99 

3,90 

1,62$ 

1,96$ 

+21 

Canada 

Dolar canadense 3,63 

3,08 

1,13 

1,18 

-4 

Chile 

Peso chileno 1.670 

3,07 

519 

544 

-5 

China 

Yuan 11,0 

1,41 

3,42 

7,77 

-56 

Colombia 

Peso colombiano 6.900 

3,06 

2.143 

2.254 

-5 

Costa Rica 

Colon 1.130 

2,18 

351 

519 

-32 

Republica Tcheca 

Coroa tcheca 52,1 

2,41 

16,2 

21,6 

-25 

Dinamarca 

Coroa dinamarquesa 27,75 

4,84 

8,62 

5,74 

+50 

Egito 

Libra egfpicia 9,09 

1,60 

2,82 

5,70 

-50 

Estonia 

Kroon 30 

2,49 

9,32 

12,0 

-23 

Zona do Euro 

Euro 2,94 

3,82 

1,10** 

1,30** 

+19 

Hong Kong 

Dolar de Hong Kong 12,0 

1,54 

3,73 

7,81 

-52 

Hungria 

Florim 590 

3,00 

183 

197 

-7 

Islandia 

Nova Coroa islandesa 509 

7,44 

158 

68,4 

+131 

Indonesia 

Rupia 15.900 

1,75 

4.938 

9.100 

-46 

Japao 

lene 280 

2,31 

87,0 

121 

-28 

Letonia 

Lats 1,35 

2,52 

0,42 

0,54 

-22 

Lituania 

Litas 6,50 

2,45 

2,02 

2,66 

-24 

Malasia 

Ringgit 5,50 

1,57 

1,71 

3,50 

-51 

Mexico 

Peso mexicano 29,0 

2,66 

9,01 

10,9 

-17 

Nova Zelandia 

Dolar neozelandes 4,60 

3,16 

1,43 

1,45 

-2 

Noruega 

Kroner 41,5 

6,63 

12,9 

6,26 

+106 

Paquistao 

Rupia paquistanesa 140 

2,31 

43,5 

60,7 

-28 

Paraguai 

Guarani 10.000 

1,90 

3.106 

5.250 

-41 

Peru 

Sol Novo 9,50 

2,97 

2,95 

3,20 

-8 

Filipinas 

Peso filipino 85,0 

1,74 

26,4 

48,9 

-46 

Polonia 

Zloty 6,90 

2,29 

2,14 

3,01 

-29 

Russia 

Rubio 49,0 

1,85 

15,2 

26,5 

-43 

Arabia Saudita 

Rial saudita 9,00 

2,40 

2,80 

3,75 

-25 

Cingapura 

Dolar de Cingapura 3,60 

2,34 

1,12 

1,54 

-27 

Eslovaquia 

Coroa 57,98 

2,13 

18,0 

27,2 

-34 

Africa do Sul 

Rand 15,5 

2,14 

4,81 

7,25 

-34 

Coreia do Sul 

Won 2.900 

3,08 

901 

942 

-4 

Sri Lanka 

Rupia 190 

1,75 

59,0 

109 

-46 

Suecia 

Coroa sueca 32,0 

4,59 

9,94 

6,97 

+43 

Suffa 

Franco suf^o 6,30 

5,05 

1,96 

1,25 

+57 

Taiwan 

Novo dolar de Taiwan 75,0 

2,28 

23,3 

32,9 

-29 

Tailandia 

Baht 62,0 

1,78 

19,3 

34,7 

-45 

Turquia 

Lira turca 4,55 

3,22 

1,41 

1,41 

nil 

Emirados Arabes 

Unidos Dirra 10,0 

2,72 

3,11 

3,67 

-15 

Ucrania 

Hrivna 9,00 

1,71 

2,80 

5,27 

-47 

Uruguai 

Peso uruguaio 55,0 

2,17 

17,1 

25,3 

-33 

Venezuela 

Bolivar 6.800 

1,58 

2.112 

4.307 

—51 


*Paridade do poder de compra: prego local dividido pelo prego nos Estados Unidos. 
**Dolares por euro. 

1 Media dos pre£OS em Nova York, Chicago, Sao Francisco e Atlanta, 
t Dolares por libra. 
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TABELA 5.10 



IPP 

IPC e IPP, Estados 



(Total dos 

Unidos, 1980-2006 

Ano 

IPC Total 

bens acabados) 

Fonte: Economic Report of 

1980 

82,4 

88,0 

the President, 2007, Tabelas 

1981 

90,9 

96,1 


1982 

96,5 

100,0 


1983 

99,6 

101,6 

1984 

103,9 

103,7 

1985 

107,6 

104,7 

1986 

109,6 

103,2 

1987 

113,6 

105,4 

1988 

118,3 

108,0 

1989 

124,0 

113,6 

1990 

130,7 

119,2 

1991 

136,2 

121,7 

1992 

140,3 

123,2 

1993 

144,5 

124,7 

1994 

148,2 

125,5 

1995 

152,4 

127,9 

1996 

156,9 

131,3 

1997 

160,5 

131,8 

1998 

163,0 

130,7 

1999 

166,6 

133,0 

2000 

172,2 

138,0 

2001 

177,1 

140,7 

2002 

179,9 

138,9 

2003 

184,0 

143,3 

2004 

188,9 

148,5 

2005 

195,3 

155,7 

2006 

201,6 

160,3 


TABELA 5.11 

Ocupa^ao 

Fumo 

Cancer 

Fumo e cancer de 
pulmao 

Fazendeiro, profissionais de atividades florestais, pescador 

77 

84 

Minerador, cavouqueiro 

137 

116 

Fonte: dispomvel em: 

Operarios da produgao de combustfveis, coque e produtos qufmicos 

117 

123 

http://lib.stat.cmu.edu/ 

Vidraceiro e ceramista 

94 

128 

DASL/Datafiles/ 

smokingandcancer.html 

Fundidor 

116 

155 

Operarios da fabrica^ao de eletroeletronicos 

102 

101 


Profissionais de engenharia e atividades associadas 

111 

118 


Madereiros, marceneiros 

93 

113 


Curtidores em confec^ao de artigos de couro 

88 

104 


Operarios da fabrica^ao de artigos textis 

102 

88 


Operarios da confecgao de vestuario 

91 

104 


Profissionais da produ^ao de alimentos, bebidas e tabaco 

104 

129 


Operarios da fabrica^ao de papel e atividades graficas 

107 

86 


Operarios da fabricafao de outros produtos 

112 

96 


Operarios da constru^ao civil 

113 

144 


Pintores e decoradores 

110 

139 


Operadores de maquinas, guindastes etc. 

125 

113 


Operarios nao inclufdos nestas categorias 

113 

146 


Profissionais de transportes e comunica^oes 

115 

128 


Estoquistas em armazens, depositos e lojas, almoxarifes, etc. 

105 

115 


Escreventes, escriturarios, funcionarios de escritorios 

87 

79 


Vendedores 

91 

85 


Profisisonais de sevifos, esportes e recreadores 

100 

120 


Administradores e gerentes 

76 

60 


Artistas e proissionais e tecnicos em geral 

66 

51 
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b. Considerando Y = mdice de mortalidade por cancer de pulmao e X — fndice de fumo, esti- 
me um modelo de regressao linear e obtenha as estatfsticas de regressao habituais. 

c. Teste a hipotese de que o fumo nao tem influencia sobre o cancer de pulmao com a — 5%. 

d. Quais as ocupagoes de maior risco em termos de mortalidade por cancer de pulmao? Voce 
pode apresentar algumas razoes para isso? 

e. Existe alguma maneira de incluir a categoria de ocupagao na analise de regressao? 


Apendice 5A 


5A.1 Distributes de probabilidade relacionadas a 
distribui£ao normal 


As distribuigoes de probabilidade t, qui-quadrado (x 2 ) e F , cujas caracteristicas mais destacadas sao dis- 
cutidas no Apendice A, estao estreitamente relacionadas a distribuigao normal. Como faremos grande uso 
dessas distribuigoes de probabilidade nos capltulos seguintes, resumiremos sua relagao com a distribuigao nor¬ 
mal nos teoremas a seguir; as demonstragoes, que estao alem do escopo deste livro, podem ser encontradas na 
bibliografia. 1 

Teorema 5.1. Se Zj, Z 2 , .... Z„ sao variaveis normal e independentemente distribuldas tais que Z, ~ N(fii, 
erf), entao, a soma Z = kj Z,-> em que os k t sao constantes diferentes de zero, tambem se distribui normalmen- 
te com media XA'fb e variancia A: 2 <r 2 ; isto e, Z ~ A(Jf kjaf). Nota: p denota o valor medio. 

Resumindo, combinagoes lineares de variaveis normais sao normalmente distribuldas. Por exemplo, se Z l5 
e Z 2 tem distribuigao normal e independente, como Z { ~ A(10, 2) e Z 2 ~ N{ 8, 1,5), a combinagao linear Z = 
0,8Zi + 0,2 Z 2 tambem se distribui normalmente com media = 0,8(10) + 0,2(8) = 9,6 e variancia = 0,64(2) + 
0,04(1,5) = 1,34, isto e, Z ~ (9,6, 1,34). 

Teorema 5.2. Se Zi, Z 2 , ..., Z„ sao variaveis aleatorias com distribuigao normal, mas nao independentes, a 
soma Z = I>,Z,-, em que os fc, sao constantes diferentes de zero, tambem se distribui normalmente com media 
^kjPj e variancia E + 2 kjkj cov (Z, , Z/), i ^ j], 

Assim, se Z x ~ N( 6, 2) e Z 2 ~ N( 7, 3) e cov (Zj, Z 2 ) = 0,8, a combinagao linear 0,6 Z x + 0,4 Z 2 tambem 
tem distribuigao normal com media = 0,6(6) + 0,4(7) = 6,4 e variancia = [0,36(2) + 0,16(3) + 2 (0,6) (0,4) 
(0,8)] = 1,584. 

Teorema 5.3. Se Z t , Z 2 ,..., Z„ sao variaveis aleatorias normal e independentemente distribuldas, tais que Z t ~ 
A(0,1), isto e, uma variavel normal padronizada, entao ^2 Zf = Zj + Z 2 +■■■ + Z\ segue a distribuigao qui- 
quadrado com n gl. Simbolicamente, Z 2 ~ xf, em que n denota os graus de liberdade. 

Resumindo, “a soma dos quadrados de variaveis normais padrao independentes tem uma distribuigao qui- 
-quadrado com um numero de graus de liberdade igual ao dos termos do somatorio”. 2 

Teorema 5.4. Se Z h Z 2 , ..., Z„ sao variaveis aleatorias com distribuigao independente, todas elas seguindo a 

distribuigao qui-quadrado com kj graus de liberdade, a soma Zi = Z\ + Z 2 +-F Z„ tambem segue uma 

distribuigao qui-quadrado com k = k t gl. 

Assim, se Z ( e Z 2 sao variaveis independentes X~ com k\ e k 2 graus de liberdade, respectivamente, entao 

Z = Zi+ Zt tambem e uma variavel x 2 com (kj + k-,) graus de liberdade. Esta e a chamada propriedade repro- 

2 

dutiva da distribuigao X . 


1 Para demonstragoes dos varios teoremas, veja MOOD, Alexander M.; CRAYBILL, Franklin A.; BOSE, Duane C. 
Introduction to the theory of statistics. 3. ed. Nova York: McGraw-Hill, 1974. p. 239-249. 

Ibid, p. 243. 


2 
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Teorema 5.5. Se Z t e uma variavel normal padronizada [Z; ~ iV(0,l)] e outra variavel Z 2 segue a distribuifao 
qui-quadrado com k graus de liberdade e e independente de Z lt entao a variavel definida como 


Zi Zi^/k variavel normal padronizada 


yfZl!yfZi yvariavel quiquadrado independente/gl 


segue a distribuifao t de Student com k graus de liberdade. Nota: essa distribuifao e discutida no Apendice A 
e ilustrada no Capftulo 5. 

Casualmente, note que quando k, os graus de liberdade, aumenta indefinidamente (quando k —> oo), a dis- 


tribui§ao t de Student aproxima-se da distribui§ao normal padrao. 3 4 Por convenijao, a notagao t k representa a 


variavel ou distribui§ao t de Student com k graus de liberdade. 

Teorema 5.6. Se Zj e Z 2 sao variaveis qui-quadrado independentemente distribufdas com k\ e k 2 graus de li¬ 
berdade, respectivamente, entao a variavel 


tern distribuicao F com k { e k 2 graus de liberdade, em que k x e conhecida como graus de liberdade do nume- 
rador e k 2 , como graus de liberdade do denominador. 

Mais uma vez, por convenfao, a nota§ao F kl k2 representa uma variavel F com k l e k 2 graus de liberdade, e 
os graus do numerador sao citados primeiro. 

Em outras palavras, o Teorema 5.6 informa que a variavel F e apenas a razao entre duas variaveis qui- 
-quadrado com distribuifoes independentes divididas pelos respectivos graus de liberdade. 

Teorema 5.7. O quadrado da variavel t (de Student) com k graus de liberdade segue uma distribuifao F com 
k\ = 1 gl no numerador e k 2 = k gl no denominador. 4 Isto e, 



Note que, para que esta igualdade se mantenha, o grau de liberdade do numerador da variavel F deve 


ser igual a 1. Assim, F 14 = t\ ou F l 22 = Z 23 e assim por diante. 


Teorema 5.8. Quando os graus de liberdade do numerador sao altos, os gl do numerador multiplicados pelo valor 
de F sao aproximadamente iguais ao valor da quiquadrado com os graus de liberdade do numerador. Assim, 


m F m%n = xf n quando n -» oo 


Teorema 5.9. Com um numero suficientemente grande de gl, a distribui 9 ao qui-quadrado pode ser aproxima- 
da pela distribuifao normal padrao da seguinte forma: 


Z = - /2 k- 1 ~ N( 0, 1) 


em que k denota os graus de liberdade. 


5A.2 Deriva^ao da equa^ao (5.3.2) 


Seja 



0 ) 


ft ~ Pi 
ep(ft) 


o 


e 



( 2 ) 


3 Uma demonstragao e encontrada em THEIL, Henri. Introduction to econometrics. Englewood Cliffs, N. J.: Prentice 
Hall, 1978. p. 237-245. 

4 Para uma demonstragao, veja as Equates (5.3.2) e (5.9.1). 
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Desde que a seja conhecido, Z\ segue a distribuigao normal padronizada, isto e, Zi ~ N (0, 1). (Por que?) 
Z 2 segue a distribuigao x 2 com (n — 2) graus de liberdade. 5 6 Alem disso, e possfvel mostrar que Z 2 tem distribui¬ 
gao independente de Z[. b Portanto, dado o Teorema 5.5, a variavel 


segue a distribuigao t com n — 2 graus de liberdade. Substituindo as Equagoes (1) e (2) na Equagao (3), obtemos 
(5.3.2). 


5A.3 Deriva^ao da equagao (5.9.1) 


A Equajao (1) mostra que Z { ~ N( 0, 1). Portanto, de acordo com o Teorema 5.3, o valor anterior 


■2 _ ( fe - fe ) 2 Z ^, 2 

1 n-2 


segue a distribuijao x 2 com 1 grau de liberdade. Como mencionado na Se§ao 5A1, 



tambem segue a distribuigao x 2 com n — 2 gl. Alem disso, como mencionado na Segao 4.3, Z 2 tern distribuigao 
independente de Z v Entao, do Teorema 5.6 segue-se que 


z\/\ _ (h ~ ft) 2 (E x , 2 ) 

Z 2 /{n- 2) X! “?/("- 2) 


segue a distribuigao F com 1 e n — 2 graus de liberdade, respectivamente. Sob a hipotese nula H 0 : fi 2 = 0, a 
razao F anterior reduz-se a Equagao (5.9.1). 


5A.4 Deriva^ao das equa^oes (5.10.2) e (5.10.6) 


Variancia da previsao media 


Com Xj = X 0 , a verdadeira previsao media E(Y 0 I A 0 ) e dada por: 

E(Y 0 | X 0 ) = P i + thXo 


( 1 ) 


Estimamos a Equagao (1) por meio de: 


Yq - Pi + P2X0 


( 2 ) 


Tomando o valor esperado da Equagao (2), dado X 0 , obtemos: 


E(Y 0 ) = E(p 0 + E(p 2 )X 0 

= Pi + P2X0 


porque e sao j3 2 estimadores nao viesados. Portanto, 


E(Y 0 ) = E(Y 0 \ X 0 ) = Pi + P 2 X 0 


(3) 


5 Uma demonstragao pode ser encontrada em HOGG, Robert V.; CRAIG, Allen T. Introduction to mathematical 
statistics. 2. ed. Nova York: Macmillan, 1965. p. 144. 

6 Veja JOHNSTON, J. Econometric methods. 3. ed. Nova York: McGraw-Hill, 1984. p. 181 -182. (Para acompanhar 
a demonstragao, e necessario ter conhecimentos de algebra matricial.) 
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Isto e, Y 0 e um previsor nao viesado de E(Y 0 I X 0 ). 

Agora, usando a propriedade de que var (a + b) = var (a) + var ( b ) + 2 cov (a, b), obtemos: 

var(fo) = var(3i) + var (£ 2)^0 + 2 cov(/Si/3 2 )^o (4) 


Empregando as formulas das variancias e da covariancia de p l e f) 2 dadas nas Equates (3.3.1), (3.3.3) e 
(3.3.9) e reorganizando os termos, obtemos 


var (7 0 ) 



(X 0 - X) 2 ' 


(5.10.2) 


Variancia da previsao individual 

Queremos prever um Y individual correspondente aX — X 0 ; isto e, desejamos obter: 


Yo - P\ + P2X0 + uo (5) 

Prevemos isso como: 

Yo = $\ + P2X0 ( 6 ) 

O erro de previsao Y 0 - Y 0 e: 

Yo - Yo = Pi + P2X0 + uq - (P\ + P2X0) 

= (/Si - /Si) + (ft - h)Xo + uo 

Portanto, 

E(Y 0 - Y 0 ) = E(fl, - 4,) + E(J3 2 - p 2 )X 0 - E(u 0 ) 

= 0 

porque ySj e f) 2 sao nao viesados, X 0 e um numero fixo e E(u 0 ) e igual a zero por hipotese. 

Elevando os dois lados ao quadrado e subtraindo os valores esperados, obtemos: var (Y 0 - F 0 ) = var (Pi) + 
Xq var (f) 2 ) + 2Z 0 cov (Pi, p 2 ) + var (u 0 ). Usando as formulas de variancia e covariancia para e j} 2 dadas 
anteriormente e observando que var(w 0 ) = a 2 , obtemos: 


var(7 0 - Y 0 ) 


1 

1 + - + 
n 


(Xq-X) 2 - 


(5.10.6) 








Capitulo 

Extensoes do modelo de 
regressao linear de duas 
variaveis 



Alguns dos aspectos da analise de regressao linear podem ser facilmente apresentados no ambito 
da estrutura do modelo de regressao linear de duas variaveis que discutimos ate o momento. Primeiro, 
consideraremos o caso da regressao que passa pela origem, em que o intercepto f J > { esta ausente do 
modelo. Depois, passaremos para a questao das unidades de medida, ou seja, como as variaveis Y e 
X sao medidas e se uma mudan^a nessas unidades afeta os resultados da regressao. Por fim, levare- 
mos em questao a forma funcional do modelo de regressao linear. Ate agora, consideramos modelos 
lineares nos parametros e nas variaveis. Mas lembre-se de que a teoria da regressao vista nos capftu- 
los anteriores requer que apenas os parametros sejam lineares; as variaveis podem, ou nao, entrar li- 
nearmente no modelo. Ao considerarmos modelos lineares nos parametros, mas nao necessariamente 
nas variaveis, mostraremos neste capitulo como os modelos de duas variaveis podem lidar com al¬ 
guns problemas praticos interessantes. 

Uma vez assimiladas essas ideias, sua extensao para modelos de regressao multipla sera bem di- 
reta, como veremos nos Capitulos 7 e 8. 


6.1 A regressao que passa pela origem 

Ha ocasioes em que a fungao de regressao populacional com duas variaveis assume a seguinte 
forma: 


Y{ - X t + Ui 


( 6 . 1 . 1 ) 


Nesse modelo, o intercepto esta ausente ou e igual a zero, daf a denominagao regressao que passa 
pela origem. 

Para ilustrar, considere o modelo de formagao de pregos de ativos (do ingles, CAPM) da teoria 
moderna de portfolio, que, na sua forma de premio de risco, pode ser expresso como: 1 

(ER, - r f ) = A(KR,„ - r f ) (6.1.2) 

em que ER, = taxa esperada de retorno do ativo i. 

ER m = taxa esperada de retomo sobre o portfolio de mercado representado, por exemplo, pelo 
indice de a?oes composto S&P 500. 


1 Veja LEVY, Haim; SARNET, Marshall. Portfolio and investment selection: theory and practice. Englewood Cliffs, N. 
J.: Prentice-Hall International, 1984. cap. 14. 
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rj = taxa de retorno livre de risco, por exemplo, o retomo das letras do Tesouro dos Estados Uni- 
dos para 90 dias. 

ft, = coeficiente beta, uma medida de risco sistematico; risco que nao pode ser eliminado por 
meio da diversificagao. Tambem uma medida da extensao em que a taxa de retomo do 
z-esimo ativo acompanha o mercado. Um ft, > 1 implica tftulo volatil ou agressivo, ao 
passo que um ft, < \ e um tftulo defensivo ou conservador. ( Nota: nao confunda este ft, 
com o coeficiente angular da regressao de duas variaveis, ft 2 ) 

Se o mercado de capitais funcionar com eficiencia, o modelo de formagao de pregos de ativos 
postula que o premio de risco esperado do z-esimo ativo (= ER, - rft e igual ao coeficiente ft desse 
ativo multiplicado pelo premio de risco esperado de mercado (= ER m - rft. Se o CAPM for valido, 
teremos a situagao da Figura 6.1. A linha mostrada e conhecida como linha do mercado de 
ativos. 

Para fins praticos, a Equagao (6.1.2) rnuitas vezes e expressa como: 

Ri ~ r f = fti(R m - r f ) + Ui (6.1.3) 

OU 

R i- r f= Ui + fti{Rm - rf) + Ui (6.1.4) 

Esse ultimo modelo e conhecido como Modelo do Mercado. 2 Se o CAPM for valido, espera-se que a, 
seja zero. (Veja a Figura 6.2.) 

Note que na Equagao (6.1.4) a variavel dependente Y e (K, - rft e a variavel explanatoria X e 
ft h o coeficiente de volatilidade, e nao ( R„, - rft. Portanto, para executar a regressao da Equagao 
(6.1.4), e preciso estimar primeiro ft h que, em geral, e obtido por meio da linha caracteristica, 
como descreve o Exerclcio 5.5. (Para mais detalhes, veja o Exerclcio 8.28.) 

Como o exemplo mostra, as vezes a teoria subjacente determina que o termo de intercepto esteja 
ausente do modelo. Outros casos em que o modelo com intercepto zero e mais adequado sao o da hi- 
potese da renda permanente de Milton Friedman, que afinna que o consumo permanente e proporcio- 
nal it renda permanente; a teoria da analise de custo, em que se postula que o custo variavel de produgao 
e proporcional ao produto; e algumas versoes da teoria monetarista que consideram que a taxa de va- 
riagao dos pregos (a taxa de inflagao) e proporcional a taxa de variagao da oferta de moeda. 


FIGURA 6.1 

Risco sistematico. 


ER,-'/ 



2 Veja, por exemplo, HARRINGTON, Diana R. Modern portfolio theory and the capital asset pricing model: a users 
guide. Englewood Cliffs, N. ).: Prentice-Hall, 1983. p. 71. 
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FIGURA 6.2 

Modelo do mercado 
da teoria de portfolio 
(supondo-se a ( = 0). 



De que maneira estimamos modelos como a Fquaqao (6.1.1) e que problemas especiais eles implicam? 
Para responder a essas perguntas, passemos a fun 5 ao de regressao amostral (FRA) da Equa£ao (6.1.1), 

Y i =p 2 X i +u i (6.1.5) 


Aplicando o metodo dos MQO na Equafao (6.1.5), obtemos as seguintes formulas para f5 2 e sua 
variancia (na Se£ao 6A.1 do Apendice 6A, encontramos as demonstra 5 oes): 


em que er e estimado por: 


h = 


HXjYi 

T, x ? 


var(^2) = 


d 2 = 


12 xf 

n - 1 


( 6 . 1 . 6 ) 

(6.1.7) 

( 6 . 1 . 8 ) 


E interessante comparar essas formulas com as obtidas quando o termo de intercepto esta incluso no 
modelo: 


6 I Zxtyi 

(3.1.6) 

,ar( fc) = Zx , 

(3.3.1) 

n — 2 

(3.3.5) 


As diferen 5 as entre os dois conjuntos de formulas sao obvias: no modelo em que o termo de intercepto 
esta ausente, usamos somas brutas de quadrados e multiplica 5 oes entre variaveis, mas, no modelo em 
que o intercepto esta presente, usamos somas ajustadas (por meio da media) de quadrados e multipli- 
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EXEMPLO 6.1 


canoes entre variaveis. Alem disso, os graus de liberdade para o calculo de a 2 sao (n — 1) no primeiro 
caso e (n - 2) no segundo caso. (Por que?) 

Embora o modelo sem intercepto, ou com intercepto igual a zero, possa ser adequado em alguns 
casos, ha varios aspectos que merecem ser observados. Primeiro, que e sempre zero para o 
modelo com o termo de intercepto (o modelo convencional), nao precisa ser zero quando esse termo 
esta ausente. Em resumo, ^2,Ui nao precisa ser igual a zero no caso das regressoes que passam pela 
origem. Segundo, r 2 , o coeficiente de determinapao apresentado no Capitulo 3, que e sempre nao 
negativo no modelo convencional, pode, em certos casos, ser negativo nos modelos em que o inter¬ 
cepto esta ausente. Esse resultado anomalo decorre do fato de que o r 2 apresentado no Capitulo 3 
assume explicitamente que o termo de intercepto esta incluido no modelo. Portanto, o r 2 calculado 
de forma convencional pode nao ser adequado para modelos em que a regressao passa pela 
origem. 3 


Calculo do r 2 para modelos que passam pela origem 

Como acabamos de observar, e como sera discutido na Senao 6A.1 do Apendice 6A, o r 2 convencio¬ 
nal apresentado no Capitulo 3 nao e adequado para as regressoes que nao content o termo de inter¬ 
cepto. Mas e possivel calcular para esses modelos o que e conhecido como r 2 bruto e definido por: 


r 1 bruto = 


ML*? 


(6.1.9) 


Nota\ essa soma dos quadrados e essa multiplica§ao de variaveis sao brutas (nao foram corrigidas pela 
media). 

Embora esse r 2 bruto atenda a relanao 0 < r 2 < 1, nao pode ser comparado diretamente ao valor do 
r 2 convencional. Por esse motivo, alguns autores nao informam o valor do r 2 no caso dos modelos de 
regressao em que o intercepto e zero. 

Devido as caracteristicas especiais desse modelo, e preciso ter muito cuidado ao usa-lo. A 
menos que exista uma expectativa a priori muito forte, seria aconselhavel ater-se ao modelo con¬ 
vencional em que o intercepto esta presente. Isso tem uma dupla vantagem. Primeiro, se o termo 
de intercepto estiver incluido no modelo, mas revelar-se estatisticamente desprezivel (isto e, esta- 
tisticamente igual a zero), para todos os fins praticos, teremos uma regressao que passa pela ori¬ 
gem. 4 Segundo, e mais importante, se de fato existir um intercepto no modelo, mas insistirmos em 
ajustar uma regressao que passa pela origem, estaremos cometendo um erro de especifica^ao. 
Falaremos mais sobre isso no Capitulo 7. 


A Tabela 6.1 apresenta dados relativos as taxas do excesso de retorno Y t (%) de um fndice de 
104 afoes do setor de bens de consumo cfclico e o excesso de retorno X t (%) do indice do 
mercado de agoes como um todo no Reino Unido durante o periodo 1980-1999, para um 
total de 240 observances. 5 Excesso de retorno refere-se ao excedente de retorno em relagao 
a um ativo livre de risco (Veja o modelo CAPM). 


( Continua ) 


3 Para uma discugao adicional veja AIGNER, Dennis, J. Basic econometrics. Englewood Cliffs, N. J.: Prentice Hall, 
1971. p. 85-88. 

4 Henri Theil destaca que, se o intercepto estiver de fato ausente, o coeficiente angular pode ser estimado com 
precisao muito maior do que quando o intercepto esta incluido. Veja sua Introduction to econometrics. Englewood 
Cliffs, N. j.: Prentice Hall, 1978. p. 76. Veja tambem o exemplo numerico a seguir. 

5 Esses dados, obtidos originalmente a partir do banco de dados DataStream, foram reproduzidos por HEI, J Christian 
et al. Econometrics methods with applications in business and economics. Oxford, Reino Unido: Oxford University 
Press, 2004. 
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TABELA 6.1 


OBS 

Y 

X 

OBS 

Y 

X 

1980:01 

6,08022852 

7,263448404 

1984:12 

3,52786616 

3,191554763 

1980:02 

-0,924185461 

6,339895504 

1985:01 

4,554587707 

3,907838688 

1980:03 

-3,286174252 

-9,285216834 

1985:02 

5,365478677 

-1,708567484 

1980:04 

5,211976571 

0,793290771 

1985:03 

4,525231564 

0,435218492 

1980:05 

-16,16421111 

-2,902420985 

1985:04 

2,944654344 

0,958067845 

1980:06 

-1,054703649 

8,613150875 

1985:05 

-0,268599528 

1,095477375 

1980:07 

11,17237699 

3,982062848 

1985:06 

-3,661040481 

-6,816108909 

1980:08 

-11,06327551 

-1,150170907 

1985:07 

-4,540505062 

2,785054354 

1980:09 

-16,77699609 

3,486125868 

1985:08 

9,195292816 

3,900209023 

1980:10 

-7,021834032 

4,329850278 

1985:09 

-1,894817019 

-4,203004414 

1980:11 

-9,71684668 

0,936875279 

1985:10 

12,00661274 

5,601 79802 

1980:12 

5,215705717 

-5,202455846 

1985:11 

1,233987382 

1,570093976 

1981:01 

-6,612000956 

-2,082757509 

1985:12 

-1,446329607 

-1,084427121 

1981:02 

4,264498443 

2,728522893 

1986:01 

6,023618851 

0,778669473 

1981:03 

4,916710821 

0,653397106 

1986:02 

10,51235756 

6,470651262 

1981:04 

22,20495946 

6,436071962 

1986:03 

13,40071024 

8,953781192 

1981:05 

-11,29868524 

-4,259197932 

1986:04 

-7,796262998 

-2,387761685 

1981:06 

-5,770507783 

0,543909707 

1986:05 

0,211540446 

-2,873838588 

1981:07 

-5,217764717 

-0,486845933 

1986:06 

6,471111064 

3,440269098 

1981:08 

16,19620175 

2,843999508 

1986:07 

-9,037475168 

-5,891053375 

1981:09 

-17,16995395 

-16,4572142 

1986:08 

-5,47838091 

6,375582004 

1981:10 

1,105334728 

4,468938171 

1986:09 

-6,756881852 

-5,734839396 

1981:11 

11,6853367 

5,885519658 

1986:10 

-2,564960223 

3,63088408 

1981:12 

-2,301451728 

-0,390698164 

1986:11 

2,456599468 

-1,31606687 

1982:01 

8,643728679 

2,499567896 

1986:12 

1,476421303 

3,521601216 

1982:02 

-11,12907503 

-4,033607075 

1987:01 

17,0694004 

8,673412896 

1982:03 

1,724627956 

3,042525777 

1987:02 

7,565726727 

6,914361923 

1982:04 

0,157879967 

0,734564665 

1987:03 

-3,239325817 

-0,460660854 

1982:05 

-1,875202616 

2,779732288 

1987:04 

3,662578335 

4,295976077 

1982:06 

-10,62481767 

-5,900116576 

1987:05 

7,157455113 

7,719692529 

1982:07 

-5,761135416 

3,005344385 

1987:06 

4,774901623 

3,039887622 

1982:08 

5,481432596 

3,954990619 

1987:07 

4,23770166 

2,510223804 

1982:09 

-17,02207459 

2,547127067 

1987:08 

-0,881352219 

-3,039443563 

1982:10 

7,625420708 

4,329008106 

1987:09 

11,49688416 

3,787092018 

1982:11 

-6,575721646 

0,191940594 

1987:10 

-35,56617624 

-27,86969311 

1982:12 

-2,372829861 

-0,92167555 

1987:11 

-14,59137369 

-9,956367094 

1983:01 

17,52374936 

3,394682577 

1987:12 

14,87271664 

7,975865948 

1983:02 

1,354655809 

0,758714353 

1988:01 

1,748599294 

3,936938398 

1983:03 

16,26861049 

1,862073664 

1988:02 

-0,606016446 

-0,32797064 

1983:04 

-6,074547158 

6,797751341 

1988:03 

-6,078095523 

-2,161544202 

1983:05 

-0,826650702 

-1,699253628 

1988:04 

3,976153828 

2,721787842 

1983:06 

3,807881996 

4,092592402 

1988:05 

-1,050910058 

-0,514825422 

1983:07 

0,57570091 

-2,926299262 

1988:06 

3,317856956 

3,128796482 

1983:08 

3,755563441 

1,773424306 

1988:07 

0,407100105 

0,181502075 

1983:09 

-5,365927271 

-2,800815667 

1988:08 

-11,87932524 

-7,892363786 

1983:10 

-3,750302815 

-1,505394995 

1988:09 

-8,801026046 

3,347081899 

1983:11 

4,898751703 

4,18696284 

1988:10 

6,784211277 

3,158592144 

1983:12 

4,379256151 

1,201416981 

1988:11 

-10,20578119 

-4,816470363 

1984:01 

16,56016188 

6,769320788 

1988:12 

-6,73805381 

-0,008549997 

1984:02 

1,523127464 

-1,686027417 

1989:01 

12,83903643 

13,46098219 

1984:03 

1,0206078 

5,245806105 

1989:02 

3,302860922 

-0,764474692 

1984:04 

-3,899307684 

1,728710264 

1989:03 

-0,155918301 

2,298491097 

1984:05 

-14,32501615 

-7,279075595 

1989:04 

3,623090767 

0,762074588 

1984:06 

3,056627177 

-0,77947067 

1989:05 

-1,167680873 

-0,495796117 

1984:07 

-0,02153592 

-2,439634487 

1989:06 

-1,221603303 

1,206636013 

1984:08 

3,355102212 

8,445977813 

1989:07 

5,262902744 

4,637026116 

1984:09 

0,100006778 

1,221080129 

1989:08 

4,845013219 

2,680874116 

1984:10 

1,691250318 

2,733386772 

1989:09 

-5,069564838 

-5,303858035 

1984:11 

8,20075301 

5,12753329 

1989:10 

-13,57963526 

-7,210655599 

( Continua ) 
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TA B E LA 6.1 ( Continuagao) 


OBS 


X 

OBS 

Y 

X 

1989:11 

1,100607603 

5,350185944 

1994:12 

-4,225370964 

0,264280259 

1989:12 

4,925083189 

4,106245855 

1995:01 

-6,302392617 

-2,420388431 

1990:01 

-2,532068851 

-3,629547374 

1995:02 

1,27867637 

0,138795213 

1990:02 

-6,601872876 

-5,205804299 

1995:03 

10,90890516 

3,231656585 

1990:03 

-1,023768943 

-2,183244863 

1995:04 

2,497849434 

2,215804682 

1990:04 

-7,097917266 

-5,408563794 

1995:05 

2,891526594 

3,856813589 

1990:05 

6,376626925 

10,57599169 

1995:06 

-3,773000069 

-0,952204306 

1990:06 

1,861974711 

-0,338612099 

1995:07 

8,776288715 

4,020036363 

1990:07 

-5,591527585 

-2,21316202 

1995:08 

2,88256097 

1,423600345 

1990:08 

-15,31758975 

-8,476177427 

1995:09 

2,14691333 

-0,037912571 

1990:09 

-10,17227358 

-7,45941471 

1995:10 

-4,590104662 

-1,17655329 

1990:10 

-2,217396045 

-0,085887763 

1995:11 

-1,293255187 

3,760277356 

1990:11 

5,974205798 

5,034770534 

1995:12 

-4,244101531 

0,434626357 

1990:12 

-0,857289036 

-1,767714908 

1996:01 

6,647088904 

1,906345103 

1991:01 

-3,780184589 

0,189108456 

1996:02 

1,635900742 

0,301898961 

1991:02 

20,64721437 

10,38741504 

1996:03 

7,8581899 

-0,314132324 

1991:03 

10,94068018 

2,921913827 

1996:04 

0,789544896 

3,034331741 

1991:04 

-3,145639589 

0,971720188 

1996:05 

-0,907725397 

-1,497346299 

1991:05 

-3,142887645 

-0,4317819 

1996:06 

-0,392246948 

-0,894676854 

1991:06 

-1,960866141 

-3,342924986 

1996:07 

-1,035896351 

-0,532816274 

1991:07 

7,330964031 

5,242811509 

1996:08 

2,556816005 

3,863737088 

1991:08 

7,854387926 

2,880654691 

1996:09 

3,131830038 

2,118254897 

1991:09 

2,539177843 

-1,121472224 

1996:10 

-0,020947358 

-0,853553262 

1991:10 

-1,233244642 

-3,969577956 

1996:11 

-5,312287782 

1,770340939 

1991:11 

-11,7460404 

-5,707995062 

1996:12 

-5,196176326 

1,702551635 

1991:12 

1,078226286 

1,502567049 

1997:01 

-0,753247124 

3,465753348 

1992:01 

5,937904622 

2,599565094 

1997:02 

-2,474343938 

1,115253221 

1992:02 

4,113184542 

0,135881087 

1997:03 

2,47647802 

-2,057818461 

1992:03 

-0,655199392 

-6,146138064 

1997:04 

-1,119104196 

3,57089955 

1992:04 

15,28430278 

10,45736831 

1997:05 

3,352076269 

1,953480438 

1992:05 

3,994517585 

1,415987046 

1997:06 

-1,910172239 

2,458700404 

1992:06 

-11,94450998 

-8,261109424 

1997:07 

0,142814607 

2,992341297 

1992:07 

-2,530701327 

-3,778812167 

1997:08 

10,50199263 

-0,457968038 

1992:08 

-9,842366221 

-5,386818488 

1997:09 

12,98501943 

8,111278967 

1992:09 

18,11573724 

11,19436372 

1997:10 

-4,134761655 

-6,967124504 

1992:10 

0,200950206 

3,999870038 

1997:11 

-4,148579856 

-0,155924791 

1992:11 

1,125853097 

3,620674752 

1997:12 

-1,752478236 

3,853283433 

1992:12 

7,639180786 

2,887222251 

1998:01 

-3,349121498 

7,379466014 

1993:01 

2,919569408 

1,336746091 

1998:02 

14,07471304 

4,299097886 

1993:02 

-1,062404105 

1,240273846 

1998:03 

7,791650968 

3,410780517 

1993:03 

1,292641409 

0,407144312 

1998:04 

5,154679109 

-0,081494993 

1993:04 

0,420241 384 

-1,734930047 

1998:05 

3,293686179 

-1,613131159 

1993:05 

-2,514080553 

1,111533687 

1998:06 

-13,25461802 

-0,397288954 

1993:06 

0,419362276 

1,354127742 

1998:07 

-7,714205916 

-2,237365283 

1993:07 

4,374024535 

1,943061568 

1998:08 

-15,26340483 

-12,4631993 

1993:08 

1,733528075 

4,961979827 

1998:09 

-15,22865141 

-5,170734985 

1993:09 

-3,659808969 

-1,618729936 

1998:10 

15,96218038 

11,70544788 

1993:10 

5,85690764 

4,215408608 

1998:11 

-8,684089113 

-0,380200223 

1993:11 

-1,365550294 

1,880360165 

1998:12 

17,13842369 

4,986705187 

1993:12 

-1,346979017 

5,826352413 

1999:01 

-1,468448611 

2,493727994 

1994:01 

12,89578758 

2,973540693 

1999:02 

8,5036 

0,937105259 

1994:02 

-5,346700561 

-5,479858563 

1999:03 

10,8943073 

4,280082506 

1994:03 

-7,614726564 

-5,784547088 

1999:04 

13,03497394 

3,960824402 

1994:04 

10,22042923 

1,157083438 

1999:05 

-5,654671597 

-4,499198079 

1994:05 

-6,928422261 

-6,356199493 

1999:06 

8,321969316 

3,656745699 

1994:06 

-5,065919037 

-0,843583888 

1999:07 

0,507652273 

-2,503971473 

1994:07 

7,483498556 

5,779953224 

1999:08 

-5,022980561 

-0,121901923 

1994:08 

1,828762662 

3,298130184 

1999:09 

-2,305448839 

-5,388032432 

1994:09 

-5,69293279 

-7,110010085 

1999:10 

-1,876879466 

4,010989716 

1994:10 

-2,426962489 

2,968005597 

1999:11 

1,348824769 

6,265312975 

1994:11 

2,125100668 

-1,531245158 

1999:12 

-2,64164938 

4,045658427 
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EXEMPLO 6.1 

( Continuagao ) 


Primeiro, ajustamos o modelo (6.1.3) aos dados. Usando o software Eviews6, obtivemos 
os seguintes resultados da regressao, apresentados no formato padrao do Eviews: 

Variavel dependente = Y 
Metodo: mfnimos quadrados 
Amostra: 1980M01 1999M12 
Observances inclufdas: 240 



Coeficiente 

Erro Padrao t-estatfstico 

Probabilidade 

X 

1,155512 

0,074396 15,53200 

0,0000 

R 2 

0,500309 

Var. dependente padrao 

0,499826 

R 2 ajustado t 

0,500309 

Var. dependente S.D. 

7,849594 

Regressao de S.E. 
Soma dos resfduos 2 

5,548786 

7358,578 

Stat. Durbin-Watson* 

1,972853 


*Discutiremos esta estatfstica no Capitulo 12. 
+ Veja Capitulo 7. 


Como esses resultados mostram, o coeficiente angular, que e o coeficiente beta, e alta- 
mente significativo, pois seu valor p e extremamente pequeno. A interpreta^ao aqui e que, 
se o excesso de retorno do mercado aumentar em um 1 ponto percentual, o excesso de re- 
torno do fndice do setor de bens de consumo aumenta em cerca de 1,15 ponto percentual. 
O coeficiente angular nao e apenas significativo, mas tambem e significativamente maior que 
1 (voce consegue verificar isso?). Se um coeficiente Beta e maior que 1, diz-se que um ativo 
como esse (aqui um portfolio de 104 a^oes) e volatil; varia mais do que proporcionalmente 
ao fndice do mercado de agioes como um todo. Mas essa conclusao nao deve surpreender, 
pois neste exemplo consideramos a^oes do setor de bens de consumo cfclico como eletrodo- 
mesticos, automoveis, produtos texteis e equipamentos esportivos. 

Se ajustarmos o modelo (6.1.4), obteremos os seguintes resultados: 

Variavel dependente = Y 
Metodo: mfnimos quadrados 
Amostra: 1980M01 1999M12 
Observances inclufdas: 240 



Coeficiente 

Erro Padrao 

t-estatfstico 

Probabilidade 

C 

-0,447481 

0,362943 

-1,232924 

0,362943 

X 

1,171128 

0,075386 

15,53500 

0,0000 

R 2 

0,503480 

Var. dependente padrao 

0,499826 

R 2 ajustado 

0,501 394 

Var. dependente S.D. 

7,849594 

Regressao de S.E. 

5,542759 

Estat. Durbin-Watson 

1,972853 

Soma dos resfduos 2 

7311,877 

Prob. (Estatfstica F) 


/-estatfstica 

241,3363 





Com base nesses resultados, vemos que o intercepto nao e estatisticamente diferente de 
zero, embora o coeficiente angular (o coeficiente beta) seja altamente significativo em ter- 
mos estatfsticos. Isso sugere que o modelo de regressao que passa pela origem ajusta-se bem 
aos dados. Alem disso, estatisticamente, nao existe diferenga no valor do coeficiente angular 
nos dois modelos. Note que o erro padrao do coeficiente angular no modelo de regressao 
que passa pela origem e ligeiramente menor do que aquele no modelo em que o intercepto 
esta presente, o que sustenta o argumento de Theil mencionado na nota de rodape 4. Mes- 
mo assim, o coeficiente angular e estatisticamente maior que 1, mais uma vez confirmando 
que os retornos das afoes do setor de bens de consumo cfclico sao volateis. 

A proposito, note que o valor de r 2 para o modelo de regressao que passa pela origem 
deve ser visto com certa reserva, pois a formula tradicional de r 2 nao se aplica a esses mode¬ 
los. No entanto, o pacote estatfstico EViews apresenta rotineiramente o valor padrao de r 2 , 
inclusive para esses modelos. 
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6.2 Escalas e unidades de medida 


Para entender as ideias desenvolvidas nesta segao, considere os dados da Tabela 6.2, que se referem ao 
investimento interno privado bruto dos Estados Unidos (IIPB) e ao produto interno bruto (P1B), em 
bilhoes e em milhoes de dolares (encadeados) de 2000. 

Suponha que, na regressao do IIPB contra o PIB, um pesquisador use dados em bilhoes de 
dolares, enquanto outro expressa as mesmas variaveis em milhoes de dolares. Os resultados da 
regressao serao iguais nos dois casos? E, se nao forem, que resultados deveriam ser usados? Re- 
sumindo, as unidades em que o regressando e o(s) regressor(es) sao medidos influenciam os resul¬ 
tados da regressao? Em caso afirmativo, qual o caminho sensato a seguir para escolher as unidades 
de medida na analise de regressao? Para responder a essas perguntas, procederemos siste- 
maticamente. Seja: 


Yi- + PiXj + Uj 


em que Y = IIPB e X= PIB. Definindo: 

Y* = W\ Yi 
X* = w 2 X t 


( 6 . 2 . 1 ) 


( 6 . 2 . 2 ) 

(6.2.3) 


em que wq e w 2 sao constantes denominadas fatores de escala; nq pode ser igual ou diferente de w 2 . 

As Equagoes (6.2.2) e (6.2.3) deixam claro que Yf e X* sao Y, e X , com outra escala. Se Y t e X, 
forem medidos em bilhoes de dolares e desejarmos expressa-los em milhoes de dolares, teremos 
Y* = 1.000 ^ e X* = 1.000 Xf, em que vtq = w 2 = 1.000. 

Considere agora a regressao que utiliza as variaveis Y* e X*\ 

y ;= $;+ fcx '+ u * (6.2.4) 

em que Y* = w\Y t , X * = w 2 Xj, e u* = w\Ui. (Por que?) 


TABELA 6.2 

Investimento interno 
privado bruto e PIB 
dos Estados Unidos, 
1990-2005 (bilhoes 
de dolares encadeados 
de 2000, exceto 
quando notificado; 
dados trimestrais 
ajustadas 
sazonalmente) 

Fonte: Economic Report of 
the President, Tabela B-2, 
p.328 


Ano 

IIPBBL 

IIPBM 

PIBB 

PIBM 

1990 

886,6 

886.600,0 

7.112,5 

7.112.500,0 

1991 

829,1 

829.100,0 

7.100,5 

7.100.500,0 

1992 

878,3 

878.300,0 

7.336,6 

7.336.600,0 

1993 

953,5 

953.500,0 

7.532,7 

7.532.700,0 

1994 

1.042,3 

1.042.300,0 

7.835,5 

7.835.500,0 

1995 

1.109,6 

1.109.600,0 

8.031,7 

8.031.700,0 

1996 

1.209,2 

1.209.200,0 

8.328,9 

8.328.900,0 

1997 

1.320,6 

1.320.600,0 

8.703,5 

8.703.500,0 

1998 

1.455,0 

1.455.000,0 

9.066,9 

9.066.900,0 

1999 

1.576,3 

1.576.300,0 

9.470,3 

9.470.300,0 

2000 

1.679,0 

1.679.000,0 

9.817,0 

9.817.000,0 

2001 

1.629,4 

1.629.400,0 

9.890,7 

9.890.700,0 

2002 

1.544,6 

1.544.600,0 

10.048,8 

10.048.800,0 

2003 

1.596,9 

1.596.900,0 

10.301,0 

10.301.000,0 

2004 

1.713,9 

1.713.900,0 

10.703,5 

10.703.500,0 

2005 

1.842,0 

1.842.000,0 

11.048,6 

11.048.600,0 


Nota: IIPBBL = investimento interno privado bruto, em bilhoes de dolares de 2000. 

IIPBM = investimento interno privado bruto, em milhoes de dolares de 2000. 
P1BB = produto interno bruto, em bilhoes de dolares de 2000. 

P1BM = produto interno bruto, em milhoes de dolares de 2000. 
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Queremos encontrar a rela^ao entre os seguintes pares: 

1 . 4, eft* 

2. p 2 e P 2 

3. var(y6,) e var(^i) 

4. var(S 2 ) e var(/S 2 ) 

5. ct 2 cct 2 

6. e 

Da teoria dos mmirnos quadrados, sabemos (veja o Capftulo 3) que: 


ft = r - 

(6.2.5) 

ft = £*? 

(6.2.6) 

pj 2 

var(^i) = ' 2 -ct 2 

«E*r 

(6.2.7) 

ct 2 

V “ <A)= e*, ! 

(6.2.8) 

«> = E "' 

n - 2 

(6.2.9) 

Aplicando o metodo dos MQO a Equagao (6.2.4), obtemos, de forma similar: 

A* = r - ?;r 

(6.2.10) 

X —\ * * 

5* zL^iVi 

Pl ~ E*,* 2 

(6.2.11) 

V Y* 2 

var(A‘) = 

»EV 

(6.2.12) 

ct* 2 

var (ft) = » 2 

l^ X i 

(6.2.13) 

A *2 

CT* 2 - 

(« - 2) 

(6.2.14) 

Com base nesses resultados, e facil estabelecer as relagoes entre os dois conjuntos de estimativas 
dos parametros. Tudo o que precisamos e recordar as seguintes definigoes: Y* = w , Y l (ou y* = w,v,); 
X* = w 2 Xi (ou x* = w 2 x ( ); u*=W\Ui, Y * = wqF; e X * = w 2 X. Usando essas definigoes, e facil verificar 

que: 


02 = ( — 

\W 2 J 

(6.2.15) 

ft = Wlft 

(6.2.16) 

CT* 2 = Vt^CT 2 

(6.2.17) 

var ((6*) = vv 2 var (/Si) 

(6.2.18) 
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var(/3*) 



2 

var ($ 2 ) 


(6.2.19) 


r 


2 

xy 


( 6 . 2 . 20 ) 


Esses resultados deixam claro que, dados os resultados da regressao baseados em uma escala de 
medida, e possfvel derivar resultados baseados em outra escala de medida uma vez que os fatores 
de escala, os w, sejam conhecidos. Entretanto, na pratica, deve-se escolher as unidades de medida 
com bom senso; nao faz muito sentido trabalhar com todos aqueles zeros ao expressar numeros em 
milhoes ou bilhoes de dolares. 

Os resultados de (6.2.15) a (6.2.20) permitem deduzir com facilidade alguns casos especiais. Por 
exemplo, se vtq = vtq, isto e, se os fatores de escala sao identicos, o coeficiente angular e seu erro pa¬ 
drao nao sao afetados quando passamos da escala (Y n X,) para (Y t , X*), o que deveria ser obvio. 
Contudo, o intercepto e seu erro padrao sao ambos multiplicados por vtq. Mas, se a escala de X nao e 
alterada (vtq = 1) e a escala de Y for alterada por um fator vtq, o coeficiente angular e o do intercepto 
e seus respectivos erros padrao sao multiplicados pelo mesmo fator vtq. Por fim, se a escala de Y per- 
manece inalterada (vtq =1) enquanto a escala de X e alterada pelo fator vtq, o coeficiente angular e seu 
erro padrao sao multiplicados pelo fator (1/ vtq), mas o coeficiente do intercepto e seu erro padrao nao 
sao afetados. 

No entanto, e preciso observar que a transformagao da escala ( Y , X) para a (y*, X*) nao afeta as 
propriedades dos estimadores de MQO examinadas nos capitulos anteriores. 


EXEMPLO 6.2 

Relagao entre 
IIPB e PIB nos 
Estados Unidos, 
1990-2005 


Para refor^armos os resultados teoricos que acabamos de apresentar, voltemos aos dados 
da Tabela 6.2 e examinemos os seguintes resultados (os numeros entre parenteses sao os 
erros padrao estimados). 

As duas variaveis estao expressas em bilhoes de dolares. 

TlPBf = - 926,090 + 0,2535 PIB t 

ep = (116,358) (0,0129) r 2 = 0,9648 ( 6 . 2 . 21 ) 


As duas variaveis expressas em milhoes de dolares: 

TlPB t = - 926.090 + 0,2535 PIB t 

ep= (116.358) (0,0129) r 2 = 0,9648 ( 6 . 2 . 22 ) 


Note que o intercepto, assim como o erro padrao, sao 1.000 vezes o valor correspondente 
na regressao (6.2.21) (note que wq = 1.000 quando passamos de bilhoes para milhoes de 
dolares), mas o coeficiente angular e seu erro padrao nao se alteram, conforme a teoria. 

IIPB em bilhoes de dolares e PIB em milhoes de dolares: 

7lPB f = - 926,090 + 0,0002535 PIB t 

ep = (116,358) (0,0000129) r 2 = 0,9648 ( 6 . 2 . 23 ) 

Como esperado, o coeficiente angular, assim como o erro padrao, e 1/1.000 seu valor na 
Equa^ao (6.2.21), ja que somente a escala de X, ou PIB foi alterada. 

IIPB em milhoes de dolares e PIB em bilhoes: 

TlPB t = - 926.090 + 253,524 PIB f 

ep= (116.358) (12,9465) r 2 = 0,9648 ( 6 . 2 . 24 ) 

Observe mais uma vez que tanto o intercepto quanto o coeficiente angular e seus respectivos 
erros padrao sao 1.000 vezes seus valores na Equa^ao (6.2.21), de acordo com nossos resul¬ 
tados teoricos. 

( Continua ) 
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EXEMPLO 6.2 

( Continuagao ) 


Note que em todas as regressoes apresentadas, o valor de r 2 permaneceu o mesmo, o 
que nao surpreende, porque esse valor nao varia com altera^oes na unidade de medida, uma 
vez que e um numero puro ou sem dimensao. 


Uma palavra sobre a interpreta^ao 

Como o coeficiente angular /3 2 e apenas a taxa de varia^ao, ele e medido nas unidades da razao: 

Unidades da variavel dependente 
Unidades da variavel esplanatoria 

Na regressao (6.2.21), a interpretapao do coeficiente angular 0,2535 da-se da seguinte maneira: se 
o P1B varia em uma unidade, de um bilhao de dolares, o investimento interno privado bruto vai variar, 
em media, 0,2535 bilhao de dolares. Na regressao (6.2.23), uma variaqao de uma unidade no P1B, de 
um rnilhao de dolares, levara a uma variaqao media de 0,0002535 bilhao de dolares no I1PB. Obvia- 
mente, os dois resultados sao identicos quanto aos efeitos do PIB sobre o IIPB; apenas estao expres¬ 
ses em unidades de medida diferentes. 


6.3 Regressao com variaveis padronizadas 

Na segao anterior, vimos que as unidades em que regressando e regressor(es) estao expressas afetam 
a interpretaqao dos coeficientes de regressao. Isso pode ser evitado se nos dispusermos a expressar 
regressando e regressor como variaveis padronizadas. Diz-se que uma variavel e padronizada se 
subtrairmos o valor medio da variavel de seus valores individuals e dividirmos a d iterate; a pelo desvio 
padrao dessa variavel. 

Assim, na regressao de Y contra X, se redefinirmos essas variaveis como: 

' (6.3.1) 

* _ X, - X 

x ' ~ ( 6 - 3 - 2 > 

em que Y = media amostral de K .SY = desvio padrao amostral de Y, X = media amostral de X, S x e 
desvio padrao amostral de X; as variaveis e Y* e X* sao chamadas variaveis padronizadas. 

Uma propriedade interessante das variaveis padronizadas e que sua media e sempre zero e seu 
desvio padrao e sempre 1. (Para uma demonstra 5 ao, veja a Segao 6A.2 do Apendice 6.) 

Em consequencia, nao importa em que unidades expressem-se o regressando e os regressores. 
Portanto, em vez de calcularmos a regressao padrao (bivariada): 

Yf = Pi + p 2 Xi + m (6.3.3) 

podemos estimar a regressao em termos de variaveis padronizadas como 

Y* = Pt + PtX* + u* (6.3.4) 

= PlK + u* (6.3.5) 

uma vez que e facil mostrar que, em uma regressao envolvendo regressando e regressor(es) padroni- 
zados, o termo de intercepto e sempre zero. 6 Os coeficientes de regressao das variaveis padronizadas, 


6 Lembre-se da Equafao (3.1.7) que o intercepto = valor medio da variavel dependente — coeficiente angular x o 
valor medio do regressor. Mas, para as variaveis padronizadas, os valores medios da variavel dependente e do 
regressor sao zero. Portanto, o valor do intercepto e zero. 
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denotados por fi*\ e fii ■ sao conhecidos na literatura especifica como coeficientes beta. * * 7 Casualmente, 
note que (6.3.5) e uma regressao que passa pela origem. 

Como interpretamos os coeficientes beta? A interpreta^ao e a seguinte: se o regressor (padroniza- 
do) aumenta, em media, em um desvio padrao, o regressando (padronizado) aumenta em /St unidades 
de desvio padrao. Ao contrario do modelo tradicional na Equa£ao (6.3.3), medimos o efeito nao nos 
termos das unidades originais em que Y e X foram expressos, mas em unidades de desvio padrao. 

Para mostrarmos a diferenfa entre as Equafoes (6.3.3) e (6.3.5), voltemos ao exemplo do IIPB e 
do P1B examinado na setjao anterior. Os resultados de (6.2.21) sao repetidos aqui por conveniencia. 

HPB, = - 926,090 + 0,2535 PIB, 

ep = (116,358) (0,0129) r 2 = 0,9648 (6.3.6) 


em que IIPB e P1B sao medidos em bilhoes de dolares. 

Os resultados correspondentes a Equa?ao (6.3.5) sao apresentados a seguir (as variaveis marcadas 
por um asterisco sao variaveis padronizadas): 


HPB * = 0,9822 PIB* 
ep = (0,0485) 


(6.3.7) 


Sabemos como interpretar a Equa^ao (6.3.6): se o PIB aumentar em media em um dolar, o IIPB 
aumentara em media cerca de 25 centavos. E a Equafao (6.3.7)? Nesse caso, a interpreta?ao e que se 
o PIB (padronizado) aumentar em um desvio padrao, em media, o IIPB (padronizado) aumentara em 
cerca de 0,98 desvio padrao. 

Qual a vantagem do modelo padronizado de regressao em relac^ao ao tradicional? A vanta- 
gem e mais evidente quando ha mais de um regressor, um topico que sera abordado no Capftu- 
lo 7. Ao padronizarmos os regressores, colocamos todos em uma mesma base e, portanto, 
podemos compara-los diretamente. Se o coeficiente de um regressor padronizado for maior 
que o de outro regressor padronizado que consta do mesmo modelo, o segundo contribui mais 
em rela£ao a explica£ao do regressando do que o primeiro. Em outras palavras, podemos usar 
os coeficientes beta como medida da for^a relativa dos varios regressores. Isso sera aprofun- 
dado nos proximos dois capftulos. 

Antes de deixarmos este topico, fa 5 amos duas observa£6es. Primeiro, no caso da regressao padro- 
nizada (6.3.7), nao apresentamos o valor de r 2 , porque esta e uma regressao que passa pela origem 
para a qual nao se aplica o habitual r 2 , como destacamos na Se£ao 6.1. Segundo, ha uma rela 5 ao in- 
teressante entre os coeficientes fi do modelo convencional e os coeficientes beta. 

Para o caso bivariado, a rela 5 ao e a seguinte: 



(6.3.8) 


em que S x = desvio padrao amostral do regressor X e .S’ v = desvio padrao amostral do regressando. 

Portanto, e possivel fazer cruzamentos entre os coeficientes /8 e beta se conhecermos o desvio 
padrao (amostral) do regressor e do regressando. Veremos no proximo capitulo que essa relacjao tam- 
bem e valida no caso da regressao nuiltipla. Deixamos ao leitor a tarefa de verificar o que ocorre com 
a Equa 5 ao (6.3.8) em nosso exemplo ilustrativo. 


6.4 Formas funcionais dos modelos de regressao 

Como mencionado no Capitulo 2, este livro trata principalmente de modelos lineares nos parametros; 

eles podem, ou nao, ser lineares nas variaveis. Nas proximas se 5 oes, trataremos alguns modelos de 


7 Nao confunda estes coeficientes beta com o coeficiente beta da teoria financeira. 
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regressao bastante usados que podem ser nao lineares nas variaveis, mas o sao nos parametros, ou que 
podem ser tornados lineares por meio de transforma 5 oes das variaveis. Em particular, discutiremos os 
seguintes modelos de regressao: 


1. Modelo log-linear 

2. Modelos semilogantmicos 

3. Modelos recfprocos 

4. Modelo rectproco logarftmico 

Examinaremos os aspectos especiais de cada modelo, quando seu uso e adequado e como sao 
estimados. Cada modelo sera ilustrado por exemplos. 


6.5 Como medir a elasticidade: o modelo log-linear 


Considere o seguinte modelo conhecido como modelo de regressao exponencial: 

Y, = (6.5.1) 

que tambem pode ser expresso como: 8 


In Y t - ln/3i + /^lnX, + m, 

em que In = logaritmo natural (logaritmo com base e, em que e = 2,718). 9 
Se escrevermos a Equa£ao (6.5.2) como 


(6.5.2) 


In Yi = a + In X t + u , 


(6.5.3) 


em que a = In este modelo e linear nos parametros a e /1 2 , linear nos logaritmos das variaveis Y e 
X, e pode ser estimado mediante uma regressao de MQO. Devido a essa linearidade, tais modelos sao 
denominados modelos log-log, duplo-log ou log-lineares. 

Se as hipoteses do modelo classico de regressao linear forem atendidas, os parametros da Equa- 
5 ao (6.5.3) podem ser estimados pelo metodo dos mmimos quadrados ordinarios sendo: 


Y* = a + /3 2 X* + u, (6.5.4) 

em que e Y*= In Yj e X* = In X t . Os estimadores de MQO a e fi 2 obtidos serao os melhores estimadores 
lineares nao viesados de a e /3 2 , respectivamente. 


FIGURA 6.3 

Modelo de 

elasticidade constante. 


Y In Y 




(a) (b) 


8 Observe estas propriedades dos logaritmos: (1) ln(/4B) = In A + In B; (2) In (A/B) = In A - In B; e (3) In (A*) = k In A, 
supondo que A e B sejam positivos e k uma constante. 

9 Na pratica, podemos usar logaritmos comuns, isto e, logaritmos de base 10. A relapao entre logaritmo natural e 
logaritmo comum e: ln e X = 2,3026log 10 X. Por convengao, In significa logaritmo natural e log, logaritmo de base 
10; nao ha necessidade de explicitar os subscritos e e 10. 
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Um aspecto atraente do modelo log-log, que o tornou muito difundido nos trabalhos aplicados, e que 
o coeficiente angular p 2 mede a elasticidade de Y em relagao a X, isto e, a variagao percentual de Y cor- 
respondente a uma dada variagao percentual (pequena) em X. 10 Se Y representa a quantidade demandada 
de um bem e X seu prego unitario, fi 2 mede a elasticidade prcco da demanda, um parametro de conside- 
ravel interesse economico. Se a relagao entre quantidade demandada e prcco for como a da Figura 6.3a, 
a transformagao log-log da Figura 6.3 b mostrara a elasticidade prego estimada (-ft 2 ). 

Podemos observar dois aspectos especiais do modelo log-linear: ele pressupoe que o coeficiente da 
elasticidade entre Ye X, /J 2 , permane 9 a constante (por que?), dai o nome alternativo modelo de elasti¬ 
cidade constante. 11 Em outras palavras, como mostra a Figura 63b, a variagao em In Y por unidade de 
variagao em In X (isto e, a elasticidade, f J > 2 ) permanece a mesma com qualquer In X utilizado para medir 
a elasticidade. Outro aspecto desse modelo e que, embora a e [j 2 sejam estimativas nao viesadas de a 
e (i\, ft 2 (o parametro que entra no modelo original), ao ser estimado como fit = antilog (a), e um esti- 
mador viesado. Contudo, na maioria dos problemas praticos, o termo de intercepto e de importancia 
secundaria e nao e necessario preocupar-se em obter sua estimativa nao viesada. 12 

No modelo de duas variaveis, o modo mais simples de decidir se o modelo log-linear ajusta-se aos 
dados e tragar o diagrama de dispersao de In Y t contra In A", e ver se os pontos aproximam-se de uma 
reta, como na Figura 63b. 

Atengdo : o leitor deve saber a diferenga entre variagao percentual e variagao de pontos percentuais. 
Por exemplo, a taxa de desemprego normalmente e expressa na forma percentual, por exemplo, de 6%. 
Se essa taxa for para 8% dizemos que a variagao em pontos percentuais na taxa de desemprego e 2, 
enquanto a variagao percentual na taxa de desemprego sera de (8 -6)16, ou cerca de 33%. Cuidado ao 
lidar com variagoes percentuais e de pontos percentuais, pois sao dois conceitos muito diferentes. 


EXEMPLO 6.3 

Despesas com 
bens duraveis em 
relagao as 
despesas totais de 
consumo pessoal 


ATabela 6.3 apresenta dados relativos as despesas totais de consumo pessoal (DESPTCP), 
despesas com bens duraveis (DESPDUR), com bens nao duraveis (DESPNAODUR) e despesas 
com servigos (DESPSERV), todas medidas em bilhoes de dolares de 2000. 13 


( Continua ) 


10 O coeficiente de elasticidade, em notagao de calculo, e definido como (dY/Y)/(dX/X) = [( dY/dX)(X/Y )]. Os leito- 
res familiarizados com o calculo diferencial verao prontamente que fi 2 e, de fato, o coeficiente de elasticidade. 

Nota tecnica: o leitor que gosta de calculo observara que d(ln X)/dX = 1/X ou d(ln X) = dX/X, isto e, para 
variagoes infinitesimals (veja o operador diferencial d), a variagao em In X e igual a variagao relativa ou propor- 
cional em X. Contudo, na pratica, se a variagao de X for pequena, esta relagao podera ser escrita como: variagao 
In X= variagao relativa em X, em que = significa "aproximadamente". Para pequenas variagoes: 

(In X t - In X ( -i) i (X t - X t -i)/X t -i = variagao relativa em X 

O leitor deve observar estes termos, que aparecerao com frequencia: (1) variagao absoluta; (2) variagao re¬ 
lativa ou proporcional; e (3) variagao percentual ou taxa de crescimento percentual. Assim, (X t - X M ) 
representa a variagao absoluta; (X t - X t _|)/X t _] = (X t /X t-1 - 1) e a variagao relativa ou proporcional; e [(X t - X w )/ 
X t _|]100 e a variagao porcentual ou taxa de crescimento. X t , e X M sao, respectivamente, os valores corrente e 
anterior da variavel X. 

11 Um modelo de elasticidade constante mostra uma variagao constante da receita total para uma dada variagao 
percentual do prego, qualquer que seja o nfvel absoluto do prego. O leitor deveria comparar este resultado com 
as condigoes de elasticidade implfcitas em uma fungao linear de demanda simples, = ^ + /3 2 X,- + u,. Contudo, 
uma fungao linear simples resulta em uma variagao constante na quantidade por unidade de variagao no prego. 
Compare com as implicagoes do modelo log-linear no caso de uma dada variagao no prego. 

12 Em relagao a natureza do vies e o que pode ser feito a respeito dele, veja COLDBERGER, Arthur S. Topics in 
regression analysis. Nova York: Macmillan, 1978. p. 120. 

13 Os bens duraveis incluem vefculos motorizados e suas pegas, moveis e eletrodomesticos; os bens nao duraveis 
incluem alimentagao, vestuario, combustfvel automotivo, oleo combustfvel e carvao; e os servigos incluem 
gastos com moradia, luz e gas, transporte e saude. 
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EXEMPLO 6.3 

( Continuagao) 


Suponha que queiramos encontrar a elasticidade das despesas com bens duraveis em 
rela^ao as despesas totais de consumo pessoal. Representando graficamente o In das despe¬ 
sas com bens duraveis contra o In das despesas totais de consumo, voce vera que a relagao 
entre as duas variaveis e linear. Portanto, o modelo log-log pode ser apropriado. Os resulta- 
dos da regressao sao os seguintes: 


In DESPDURf= -7,5417 + 
ep= (0,7161) 
t= (-10,5309)* 


1,6266 In DESPTCPf 
(0,0800) 

(20,3152)* r 2 = 0,9695 


em que * indica que o valor p e extremamente pequeno. 


(6.5.5) 


TABELA 6.3 

Despesa pessoal 
total e categorias 
(em bilhoes de 
dolares encadeados 
de 2000) 

Fonte: Economic Report 
of the President, 1999, 
Quadro B-17, p. 34 


Ano-Trimestre 

DESPSERV 

DESPDUR 

DESPNAODUR 

DESPTCP 

2003-1 

4.143,3 

971,4 

2.072,5 

7.184,9 

2003-11 

4.161,3 

1.009,8 

2.084,2 

7.249,3 

2003-111 

4.190,7 

1.049,6 

2.123,0 

7.352,9 

2003-IV 

4.220,2 

1.051,4 

2.132,5 

7.394,3 

2004-1 

4.268,2 

1.067,0 

2.155,3 

7.479,8 

2004-11 

4.308,4 

1.071,4 

2.164,3 

7.534,4 

2004-111 

4.341,5 

1.093,9 

2.184,0 

7.607,1 

2004-IV 

4.377,4 

1.110,3 

2.213,1 

7.687,1 

2005-1 

4.395,3 

1.116,8 

2.241,5 

7.739,4 

2005-11 

4.420,0 

1.150,8 

2.268,4 

7.819,8 

2005-111 

4.454,5 

1.175,9 

2.287,6 

7.895,3 

2005-IV 

4.476,7 

1.137,9 

2.309,6 

7.910,2 

2006-1 

4.494,5 

1.190,5 

2.342,8 

8.003,8 

2006-11 

4.535,4 

1.190,3 

2.351,1 

8.055,0 

2006-111 

4.566,6 

1.208,8 

2.360,1 

8.111,2 


Nota: DESPSERV = despesas com servigos. 

DESPDUR = despesas com bens duraveis. 
DESPNAODUR = despesas com bens nao duraveis. 
DESPTCP = despesas totais de consumo pessoal. 


Como esses resultados sugerem, a elasticidade de DESPDUR em rela^ao a DESPTCP e de 
cerca de 1,63, sugerindo que quando as despesas totais aumentam em 1% as despesas com 
bens duraveis aumentam em cerca de 1,63%, em media. As despesas com bens duraveis sao 
muito sensfveis a variagoes nas despesas totais de consumo pessoal. Essa e uma das razoes 
pelas quais os produtores de bens duraveis acompanham atentamente as varia^oes na renda 
e nas despesas de consumo pessoal. No Exercfcio 6.18 pede-se que o leitor faga um estudo 
semelhante para as despesas com bens nao duraveis e com servi^os. 


6.6 


Modelos semilogaritmicos: log-lin e lin-log 


Como medir a taxa de crescimento: o modelo log-lin 

Economistas, homens de negocios e governos frequentemente estao interessados em conhecer a 
taxa de crescimento de algumas variaveis economicas como a popula§ao, o PNB, a oferta de moeda, 
o emprego, a produtividade e o deficit comercial. 

Suponha que queiramos conhecer a taxa de crescimento das despesas pessoais com services para 
os dados fornecidos na Tabela 6.3. Denotemos por Y, as despesas reais com services no perfodo 1 e 
por Y 0 o valor inicial dessas despesas (o valor ao fim do quarto trimestre de 2002). Recordando a 
conhecida formula dos juros compostos, temos: 


Y t = 7 0 (1 + r)‘ 


( 6 . 6 . 1 ) 
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em que re a taxa de crescimento composta ou geometrica (ao longo do tempo) de Y. Usando o loga- 
ritmo natural da Equagao (6.6.1), podemos escrever: 

In 7, = ln7 0 + ?ln(l + r) (6.6.2) 

Agora, considerando 

Pi = In Y 0 (6.6.3) 

Pi = In (1 + r) (6.6.4) 

podemos escrever a Equagao (6.6.2) como: 

In Y,= p i + p 2 t (6.6.5) 

Incluindo o termo de erro na Equagao (6.6.5), obtemos: 14 

In Y t = Pi + p 2 t + ui (6.6.6) 

Esse modelo e semelhante a qualquer outro de regressao linear no sentido de os parametros p t e 
P 2 serem lineares. A unica diferenga e que o regressando e o logaritmo de Y e o regressor e o “tempo”, 
que assumira os valores 1, 2, 3 etc. 

Modelos como a Equagao (6.6.6) sao chamados de modelos semilogarftmicos, porque apenas 
uma das variaveis (neste caso, o regressando) esta em forma logaritmica. Para fins de descrigao, um 
modelo em que o regressando aparece em forma logaritmica e chamado de modelo log-lin. Mais 
adiante, veremos um modelo em que o regressando e linear, mas o(s) regressor(es) e (sao) 
logantmico(s), e e conhecido como modelo lin-log. 

Antes de apresentarmos os resultados da regressao, examinemos as propriedades do modelo 
(6.6.5). Neste, o coeficiente angular mede a variagao proporcional ou relativa constante em Ypara 
uma dada variagao absoluta no valor do regressor (neste caso, a variavel f), isto e, 15 

variagao relativa no regressando 

f$2 — - 

variagao absoluta no regressor (6.6.7) 

Se multiplicarmos a variagao relativa de Y por 100, a Equagao (6.6.7) nos dara a variagao percen- 
tual ou a taxa de crescimento de Y para uma variagao absoluta em X, o regressor. Isto e, 100 multipli- 
cado por p 2 nos da a taxa de crescimento de Y; 100 multiplicado por P 2 e conhecido na literatura 
especifica como a semielasticidade de Y em relagao a X. (Pergunta: para obter a elasticidade, o que 
devemos fazer?) 16 


EXEMPLO 6.4 

A taxa de 
crescimento das 
despesas com 
servigos 


Para ilustrar o modelo de crescimento (6.6.6), considere os dados relativos a despesas 
com servigos da Tabela 6.3. Os resultados da regressao sao os seguintes: 

fnl5ESPSERV t = 8,3226 + 0,00705t 

ep = (0,0016) (0,00018) r 2 = 0,9919 ( 6 . 6 . 8 ) 

t= (5201,625)* (39,1667)* 


Nota: DESPSERV representa os gastos com servigos e * indica que o valor p e extremamente 
pequeno. 

( Continua ) 


14 Acrescentamos o termo de erro, porque a formula dos juros compostos nao funciona com precisao. Na Segao 
6.8 explicaremos por que se acrescenta o termo de erro apos a transformagao logaritmica. 

15 Usando calculo diferencial, podemos demonstrar que ft 2 = d(ln Y)/dX = (1 /Y)(dY/dX) = ( dY/Y)/dX, que nao e outra 
coisa senao a Eq+uagao (6.6.7). Para pequenas variagoes em YeX, esta relagao pode ser aproximada por: 

( 7 - Yt-A/Yt-i 
(X t X,-i) 

Nota: aqui, X = t. 

16 Veja no Apendice 6A.4 diversas formulas de crescimento. 
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EXEMPLO 6.4 

( Continuagao) 


A interpretafao da Equapao (6.6.8), em um perfodo que vai do 1° trimestre de 2003 ao 
3° trimestre de 2006, implica que as despesas com servifos aumentaram a uma taxa (trimes- 
tral) de 0,705%, aproximadamente igual a uma taxa de crescimento anual de 2,82%. Como 
8,3226 = log de DESPSERV no infcio do perfodo estudado, ao tomarmos seu antilogaritmo, 
obtemos 4.115,96 (bilhoes de $) como o valor inicial de DESPSERV (o valor ao fim do quarto 
trimestre de 2003). A linha de regressao da Equapao (6.6.8) esta esbogada na Figura 6.4. 


FIGURA 6.4 
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Taxas de crescimento instantdneas versus taxas compostas 

O coeficiente da variavel de tendencia do modelo de crescimento (6.6.6), /C, da a taxa de crescimento 
instantanea (em um ponto do tempo), nao a composta (ao longo de um perfodo de tempo). Mas esta 
ultima pode ser obtida com facilidade a partir da Equa£ao (6.6.4) tomando-se o antilogaritmo do f} 2 
estimado, subtraindo-o de um e multiplicando a diferenpa por 100. Em nosso exemplo, o coeficiente 
angular estimado e 0,00705. Portanto, [antilog (0,00705) - 1] = 0,00708 ou 0,708%. Logo, neste 
exemplo, a taxa de crescimento composta das despesas com services foi de cerca de 0,708% por 
trimestre, que e ligeiramente mais alta do que a de crescimento instantanea de 0,705%. A diferen 9 a 
obviamente se deve ao efeito da compos^ao. 


Modelo de tendencia linear 

Em vez de estimarem o modelo (6.6.6), os pesquisadores as vezes estimam o seguinte modelo: 


Y t = Pi + fat + u, (6.6.9) 

Ou seja, em vez de fazerem a regressao do log de Y contra o tempo, fazem a regressao de Y contra 
o tempo, em que Y e o regressando em questao. Esse modelo e conhecido como modelo de tendencia 
linear, e a variavel de tempo t e conhecida como variavel de tendencia. Se o coeficiente angular na 
Equa^ao (6.6.9) for positivo, Y apresentara uma tendencia crescente; se for negativo, Y tera tenden¬ 
cia decrescente. 

No caso das despesas com servhjos que vimos anteriormente, o resultado do ajustamento do mo¬ 
delo de tendencia linear (6.6.9) e o seguinte: 


DESPSERV, = 4111,545 + 30,674? 

t= (655,5628) (44,4671) 


r 2 = 0,9935 


( 6 . 6 . 10 ) 


Em contraste com a Equac:ao (6.6.8), a interpreta 5 ao da Equa 5 ao (6.6.10) e a seguinte: entre o primeiro 
trimestre de 2003 e o terceiro trimestre de 2006, as despesas com serv^os aumentaram em media a 
taxa absoluta (, atengao: nao taxa relativa) de cerca de $30 bilhoes por trimestre. As despesas com 
servicos registraram uma tendencia crescente. 

A escolha entre um modelo de taxa de crescimento (6.6.8) e modelo de tendencia linear (6.6.10) 
dependera de estarmos interessados na varia 5 ao relativa ou absoluta das despesas com serv^os, 





182 


Parte Um 


Modelos de regressao com equaqao imica 


embora, para fins de comparapao, em geral, e a variapao relativa que apresenta maior relevancia. Note 
que nao podemos comparar os valores de r dos modelos (6.6.8) e (6.6.10), porque os regressandos 
dos dois modelos sao diferentes. Mostraremos no Capftulo 7 como comparar os r 2 de modelos como 
(6.6.8) e (6.6.10). 

O modelo lin-log 

Diferentemente do modelo de crescimento que acabamos de discutir, no qual estavamos interessados 
em conhecer o crescimento percentual de Y para uma variapao absoluta de X, suponha agora que quei- 
ramos conhecer a variapao absoluta de Y dada uma variapao percentual de X. Um modelo que poderia 
atingir esse proposito seria: 

Yi = Pi + ftlnX, + Ui (6.6.11) 

Para fins descritivos, denominamos esse tipo de modelo lin-log. 

Vamos, agora, interpretar o coeficiente angular /3 2 17 . Como sempre, 

variapao de Y 
variapao de In X 
variapao de Y 
variapao relativa deX 

A segunda expressao segue-se do fato de que uma variapao no logaritmo de um niimero e uma varia- 
gao relativa. 

Simbolicamente, temos: 


( 6 . 6 . 12 ) 

em que, como de costume, A denota uma pequena variapao. A Equapao (6.6.12) pode ser escrita de modo 
equivalente como: 

AY=p 2 (AX/X) (6.6.13) 

Essa equapao indica que a variapao absoluta de Y (= AY) t igual ao coeficiente angular multiplicado pela 
variapao relativa em X. Se esta ultima for multiplicada por 100, a Equapao (6.6.13) fomecera a variapao 
absoluta de Y para uma variapao percentual de X. Se (AX/X) variar em 0,01 unidade (ou 1%), a varia¬ 
pao absoluta de Y sera de 0,0l(/3 2 ); se, em uma aplicapao, obtermos /J 2 = 500, a variapao absoluta de Y 
sera de (0,01) (500) = 5,0. Portanto, quando estimar a regressao (6.6.11) por meio dos MQO, nao se 
esquepa de multiplicar o coeficiente angular estimado por 0,01, ou de dividi-lo por 100. Se voce nao tiver 
isso em mente, a interpretagao dos resultados de uma aplicagao sera tremendamente equivocada. 

A questao e: quando um modelo lin-log, como a Equapao (6.6.11), e util? Uma aplicapao interes- 
sante sao os chamados modelos de despesas de Engel, assim denominados em homenagem ao esta- 
tistico alemao Ernst Engel (1821-1896). (Veja o Exercicio 6.10.) Engel postulou que “o total das 
despesas com alimentapao tende a aumentar em progressao aritmetica enquanto as despesas totais 
aumentam em progressao geometrica”. 18 


17 Novamente, usando o calculo diferencial, temos: 



portanto, 

p 2 = 2= (6.6.12) 
x 

18 Veja MUKHERJEE, Chandan; WHITE, Howard; WUYTS, Marc. Econometrics and data analisys for developing 
countries. Londres: Routledge, 1998. p. 158. Esta citapao e atribufda a WORKING, H. "Statistical laws of family 
expenditure." Journal of Ihe American Statistical Association, 1943. v. 38, p. 43-56. 
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EXEMPLO 6.5 Para ilustrar o modelo lin-log, voltemos as despesas com alimenta^ao na India, o Exemplo 

3.2. La ajustamos um modelo linear nas variaveis como primeira aproximagao. Mas, se repre- 
sentarmos os dados graficamente, obteremos o diagrama de dispersao da Figura 6.5. Como 
a figura sugere, as despesas com alimenta^ao aumentam mais lentamente do que as despe¬ 
sas totais, o que parece confirmar a lei de Engel. Os resultados do ajustamento de um mode¬ 
lo lin-log a estes dados sao os seguintes: 


FIGURA 6.5 


DespAlimentagao, = - 1283,912 + 257,2700 In DespTot, 

t= (- 4,3848)* (5,6625)* r 2 = 0,3769 

Nota: *denota um valor p extremamente pequeno. 
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( 6 . 6 . 14 ) 


Interpretado como anteriormente, o coeficiente angular de cerca de 257 significa que um 
aumento de 1%, em media, nas despesas totais leva a um aumento de cerca de 2,57 rupias 
nas despesas com alimentos das 55 familias inclufdas na amostra. (Nota: dividimos o coefi¬ 
ciente estimado por 100.) 

Antes de prosseguir, note que, se voce quiser calcular o coeficiente de elasticidade dos 
modelos log-lin ou lin-log, deve faze-lo com base no coeficiente de elasticidade apresentado 
anteriormente, ou seja, 

Elasticidade = 

dX Y 

Evidentemente, uma vez conhecida a forma funcional de um modelo, podemos calcular as 
elasticidades aplicando a definifao anterior. (Mais adiante, a Tabela 6.6 resumira os coeficien- 
tes de elasticidade dos varios modelos.) 


Deve-se ressaltar que, as vezes, a transforma 5 ao logarftmica e usada para reduzir a heterocedasti- 
cidade assim como a assimetria (skewness). (Veja o Capitulo 11.) Uma caracteristica comum de muitas 
variaveis economicas e que elas sao assimetricas positivas (por exemplo, a distribui§ao de tamanho 
das empresas ou a distribu^ao da renda ou da riqueza) e heterocedasticas. Uma transforma 5 ao loga- 
ritmica de tais variaveis reduz tanto a assimetria quanto a heterocedasticidade. E por esse motivo que 
economistas do trabalho usam logaritmos dos salarios na regressao dos salarios, por exemplo, contra 
escolaridade, medida em anos de estudo. 


6.7 Modelos recfprocos 


Os modelos do tipo a seguir sao conhecidos como reciprocos: 


Yi 


P\ + Pi 



+ Hi 


(6.7.1) 
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Embora este modelo seja nao linear na variavel X, porque entra de modo inverso ou recfproco, o 
modelo e linear em fi\ e f} 2 e, portanto, e um modelo de regressao linear. 19 

Este modelo apresenta os seguintes aspectos: quando X aumenta indefinidamente, o termo /3 2 (1/X) 
tende a zero ( nota: f} 2 e uma constante) e Y aproxima-se do valor-limite ou assintotico /l,. 

Portanto, modelos como (6.7.1) trazem embutido um valor assmtota ou limite que a variavel 
dependente assumira quando o valor da variavel X aumentar indefinidamente. 20 

A Figura 6.6 apresenta algumas das formas provaveis da curva correspondente a Equagao 
(6.7.1). 



EXEMPLO 6.6 Para ilustrar a Figura 6.6a, considere os dados da Tabela 6.4. Sao dados de corte transver¬ 

sal relativos a mortalidade infantil e algumas outras variaveis em 64 pafses. Por enquanto, 
vamos examinar as variaveis mortalidade infantil (Ml) e PNB per capita, que estao representa- 
das graficamente na Figura 6.7. 

Como se ve, essa figura assemelha-se a Figura 6.6 a: a medida que o PNB per capita au¬ 
menta, seria de esperar uma redugao da mortalidade infantil, porque as pessoas podem ter 
maiores gastos com saude, mantendo tudo o mais constante. Mas essa relagao nao e uma 
linha reta: quando o PNB per capita aumenta, inicialmente ha uma redugao substancial da 
mortalidade infantil, mas a queda ameniza-se com o aumento contfnuo do PNB per capita. 


FIGURA 6.7 

Relagao entre 
mortalidade infantil 
e PNB per capita em 
64 pafses. 
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( Continua ) 


19 Se considerarmos X*= (1/x,), entao a Equagao (6.7.1) e linear nos parametros, bem como as variaveis Y,e X*. 

20 O coeficiente angular de (6.7.1) e: dY/dX = - ft 2 ( 1 /^ 2 )< implicando que, se ft 2 f° r positivo, o coeficiente angular 
e sempre negativo; e se ft 2 for negativo, o coeficiente angular sera sempre positivo. Veja as Figuras 6.6a e 6.6c, 
respectivamente. 
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EXEMPLO 6.6 

( Continuagao) 


TARFI A 6 4 


Observacao 

Ml 

TAF 

PNBpc 

TFT 

Observacao 

Ml 

TAF 

PNBpc 

TFT 

Fecundidade e 

outras informa§6es 

i 

128 

37 

1870 

6,66 

33 

142 

50 

8640 

7,17 

2 

204 

22 

130 

6,15 

34 

104 

62 

350 

6,60 

para 64 pafses 

3 

202 

16 

310 

7,00 

35 

287 

31 

230 

7,00 


4 

197 

65 

570 

6,25 

36 

41 

66 

1620 

3,91 

5 

96 

76 

2050 

3,81 

37 

312 

11 

190 

6,70 

6 

209 

26 

200 

6,44 

38 

77 

88 

2090 

4,20 

7 

170 

45 

670 

6,19 

39 

142 

22 

900 

5,43 

8 

240 

29 

300 

5,89 

40 

262 

22 

230 

6,50 

9 

241 

11 

120 

5,89 

41 

215 

12 

140 

6,25 

10 

55 

55 

290 

2,36 

42 

246 

9 

330 

7,10 

11 

75 

87 

1180 

3,93 

43 

191 

31 

1010 

7,10 

12 

129 

55 

900 

5,99 

44 

182 

19 

300 

7,00 

13 

24 

93 

1730 

3,50 

45 

37 

88 

1730 

3,46 

14 

165 

31 

1150 

7,41 

46 

103 

35 

780 

5,66 

15 

94 

77 

1160 

4,21 

47 

67 

85 

1300 

4,82 

16 

96 

80 

1270 

5,00 

48 

143 

78 

930 

5,00 

17 

148 

30 

580 

5,27 

49 

83 

85 

690 

4,74 

18 

98 

69 

660 

5,21 

50 

223 

33 

200 

8,49 

19 

161 

43 

420 

6,50 

51 

240 

19 

450 

6,50 

20 

118 

47 

1080 

6,12 

52 

312 

21 

280 

6,50 

21 

269 

17 

290 

6,19 

53 

12 

79 

4430 

1,69 

22 

189 

35 

270 

5,05 

54 

52 

83 

270 

3,25 

23 

126 

58 

560 

6,16 

55 

79 

43 

1340 

7,17 

24 

12 

81 

4240 

1,80 

56 

61 

88 

670 

3,52 

25 

167 

29 

240 

4,75 

57 

168 

28 

410 

6,09 

26 

135 

65 

430 

4,10 

58 

28 

95 

4370 

2,86 

27 

107 

87 

3020 

6,66 

59 

121 

41 

1310 

4,88 

28 

72 

63 

1420 

7,28 

60 

115 

62 

1470 

3,89 

29 

128 

49 

420 

8,12 

61 

186 

45 

300 

6,90 

30 

27 

63 

19830 

5,23 

62 

47 

85 

3630 

4,10 

31 

152 

84 

420 

5,79 

63 

178 

45 

220 

6,09 

32 

224 

23 

530 

6,50 

64 

142 

67 

560 

7,20 


Nota: MI = mortalidade infantil: numero anual de obitos de crian^as menores de 5 anos por 1.000 nascidos vivos. 

TAF = taxa de alfabetiza 5 ao feminina (em %). 

PNBpc = PNB per capita em 1980. 

TFT = taxa de fecundidade total, 1980-1985: numero medio de filhos por mulher, com base em taxas de fecundidade 
segundo a idade, em determinado ano. 


Fonte: MUKHERJEE, Chandan; WHITE, Howard; WHYTE, Mark. Econometrics and data analysis for developing countries. 
Londres: Routledge, 1998. p. 456. 


Se ajustarmos o modelo recfproco (6.7.1), obteremos os seguintes resultados da regressao: 

Ml; = 81,79436+ 27.237,17^^—) 

ep= (10,8321) (3759,999) ( 6 . 7 . 2 ) 

f= (7,5511) (7,2535) r 2 = 0,4590 


Na medida em que o PNB per capita aumenta indefinidamente, a mortalidade infantil aproxi- 
ma-se de seu valor assintotico de cerca de 82 obitos por mil. Como explicado na nota de roda- 
pe 20, o valor positivo do coeficiente de (1 /PNB t ) implica que a taxa de variafao de mortalidade 
infantil em relagao ao PNB per capita seja negativa. 


( Continua ) 
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EXEMPLO 6.6 

(' Continuagao ) 

FIGURA 6.8 

Curva de Phillips. 



Uma das aplica^oes importantes da Figura 6.6 b e a famosa curva de Phillips da macro- 
economia. Com os dados de variagao percentual dos salarios nominais (VO e a taxa de desem- 
prego (X) do Reino Unido no perfodo de 1861 a 1957, Phillips obteve uma curva cuja forma 
geral se assemelha a da Figura 6.6b (Figura 6.8). 21 

Como a Figura 6.8 mostra, ha uma assimetria na rea^ao das variagoes salariais ao nfvel da 
taxa de desemprego: os salarios aumentam mais rapidamente por unidade de variagao no 
desemprego se esta taxa situa-se abaixo de U N , que e denominada pelos economistas como 
taxa natural de desemprego (definida como a taxa de desemprego necessaria para a manuten- 
5 §o da inflagao [dos salarios] constante), e depois caem para uma varia^ao equivalente quan- 
do a taxa de desemprego esta acima de sua taxa natural U N , indicando o piso assintotico, ou - fa, 
para a variagao dos salarios. Esse aspecto especffico da curva de Phillips pode ser decorrente 
de fatores institucionais, como o poder de barganha dos sindicatos, o salario mfnimo, o 
auxflio desemprego etc. 

Desde a publicagao do artigo de Phillips, muito foi pesquisado sobre o assunto, tanto em 
termos teoricos quanto praticos. O espa^o nao nos permite aprofundar nos detalhes da contro¬ 
versy que cerca a curva de Phillips e a propria curva ja passou por varias encarnagdes. Uma 
formula^ao relativamente recente e oferecida por Olivier Blanchard. 22 Seja n t a taxa de infla^ao 
no perfodo f, que e definida como a varia^ao percentual do nfvel de pre^os medida por um 
fndice representativo como o fndice de Pre^os ao Consumidor (IPC), e UN t a taxa de desempre¬ 
go no perfodo t. Entao, a versao moderna da curva de Phillips pode ser expressa da seguinte 
forma: 


Ti t - *f= ^(UNt- U N )+ u t 


( 6 . 7 . 3 ) 


em que n t = taxa de inflagao vigente no perfodo t 

tt f = taxa de infla^ao esperada para o perfodo f, com expectativa formada no ano (f - 1) 

( Continua ) 


21 PFHILLIPS, A. W. "The relationship between unemployment and the rate of change of money wages in the 
United Kingdom, 1861-1957." Economica, nov. 1958. v. 15. p. 283-299. Note que a curva original nao corta o 
eixo da taxa de desemprego, mas a Figura 6.8 apresenta uma versao posterior da curva. 

22 Veja BLANCHARD, Olivier. Macroeconomics. Englewood Cliffs, N. ).: Prentice Hall, 1997. cap. 17. (Traduzido 
para o portugues pela editora Campus sob o tftulo Macroeconomia.) 
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EXEMPLO 6.6 UNf = taxa de desemprego vigente no perfodo t 

( Continuagao) U N = taxa natural de desemprego 

u t = termo de erro estocastico 23 

Como jzf nao pode ser observado diretamente, podemos, como ponto de partida, fazer 
a hipotese simplificadora de que jzf = 7v t _ u isto e, a inflag:ao esperada para este ano e a taxa 
de infla^ao vigente no ano anterior; obviamente, e possfvel postular hipoteses mais comple- 
xas para a forma^ao de expectativas e discutiremos este topico no Capftulo 1 7, sobre mode- 
los com defasagens distribufdas. 

Substituindo essa hipotese na Equafao (6.7.3) e escrevendo o modelo de regressao no 
formato padrao, obtemos a seguinte equagao de estimativa: 

7t t -7r t _i = jSi + jS 2 UN t + u t (6.7.4) 

em que fa = -faU N . A Equafao (6.7.4) indica que a varia^ao da taxa de infla^ao entre dois 
perfodos relaciona-se linearmente com a taxa de desemprego corrente. A priori, espera-se que 
fa seja negativo (por que?) e fa, positivo (nao surpreende, pois fa e negativo e U N , positivo). 

A rela^ao de Phillips da Equafao (6.7.3) e conhecida na literatura especffica como curva 
de Phillips modificada ou curva de Phillips com expectativas (para indicar que ir,_i 
representa a infla^ao esperada) ou a curva aceleracionista de Phillips (para sugerir que 
uma taxa de desemprego baixa provoca um aumento da taxa de infla^ao e, em consequen- 
cia, uma aceleragao na variafao do nfvel de pre^os). 


EXEMPLO 6.7 Para ilustrar a curva de Phillips modificada, apresentamos na Tabela 6.5 dados relativos a 

inflagao medida pela variagao anual do fndice de pre^os ao consumidor (IPC) e a taxa de 
desemprego durante o perfodo 1960-2006. A taxa de desemprego refere-se ao desemprego 
civil. Com base nesses dados, obtivemos a variag:ao da taxa de inflagao (jr t - tt^i), a qual 
representamos graficamente contra a taxa de desemprego civil; usamos o IPC dos Estados 
Unidos como medida da infla^ao. A Figura 6.9 mostra o grafico. 

Como esperado, a relagao entre a variag:ao da taxa de inflagao e a taxa de desemprego e 
negativa — uma taxa de desemprego baixa leva a um aumento na taxa de infla^ao e, por- 
tanto, a uma acelera^ao no nfvel de pre^os, daf o nome de curva aceleracionista de Phillips. 

Observando a Figura 6.9, nao fica obvio se um modelo de regressao linear (linha reta) ou 
um modelo recfproco seria mais adequado aos dados; pode haver uma relagao curvilfnea 
entre as duas variaveis. A seguir apresentamos os resultados de regressoes baseadas em am- 
bos os modelos. Tenha em mente que, no modelo recfproco, espera-se um intercepto nega¬ 
tivo e um coeficiente angular positivo, como observamos na nota de rodape 20. 

Modelo linear: = 3,7844 - 0,6385 UN f 

f- (4,1912) (-4,2756) r 2 = 0,2935 ^ 6-7 ‘ 5 ^ 


Modelo recfproco: 

(^^Ti) = - 3,0684 + 17 < 2077 (^ ( ) 

t= (-3,1635) (3,2886) r 2 = 0,1973 


(6.7.6) 


Todos os coeficientes estimados nos dois modelos sao, individualmente, estatisticamente 
significativos, pois todos os valores p sao inferiores ao nfvel de 0,005. 


( Continua ) 


23 Os economistas consideram que este termo de erro representa algum tipo de choque de oferta, como os em- 
bargos do petroleo da OPEP de 1973 e 1979. 
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EXEMPLO 6.7 

(' Continuagao ) 

TABELA 6.5 

Taxa de inflaqao e 
taxa de desemprego 
nos Estados Unidos, 
1960-2006 (para 
todos os 
consumidores 
urbanos; 1982-1984 
= 100, exceto 
quando notificado) 

Fonte: Economic Report of 
the President, 2007, 

Quadro B-60, p. 399, para 
o IPC; e Quadro B-42, 
p. 376, para a taxa de 
desemprego 


FIGURA 6.9 

Curva de Phillips 
modificada. 


Ano 

TAXINFL 

TAXDES 

Ano 

TAXINFL 

TAXDES 

1960 

1,718 

5,5 

1984 

4,317 

7,5 

1961 

1,014 

6,7 

1985 

3,561 

7,2 

1962 

1,003 

5,5 

1986 

1,859 

7,0 

1963 

1,325 

5,7 

1987 

3,650 

6,2 

1964 

1,307 

5,2 

1988 

4,137 

5,5 

1965 

1,613 

4,5 

1989 

4,818 

5,3 

1966 

2,857 

3,8 

1990 

5,403 

5,6 

1967 

3,086 

3,8 

1991 

4,208 

6,8 

1968 

4,192 

3,6 

1992 

3,010 

7,5 

1969 

5,460 

3,5 

1993 

2,994 

6,9 

1970 

5,722 

4,9 

1994 

2,561 

6,1 

1971 

4,381 

5,9 

1995 

2,834 

5,6 

1972 

3,210 

5,6 

1996 

2,953 

5,4 

1973 

6,220 

4,9 

1997 

2,294 

4,9 

1974 

11,036 

5,6 

1998 

1,558 

4,5 

1975 

9,128 

8,5 

1999 

2,209 

4,2 

1976 

5,762 

7,7 

2000 

3,361 

4,0 

1977 

6,503 

7,1 

2001 

2,846 

4,7 

1978 

7,591 

6,1 

2002 

1,581 

5,8 

1979 

11,350 

5,8 

2003 

2,279 

6,0 

1980 

1 3,499 

7,1 

2004 

2,663 

5,5 

1981 

10,316 

7,6 

2005 

3,388 

5,1 

1982 

6,161 

9,7 

2006 

3,226 

4,6 

1983 

3,212 

9,6 




Nota: a taxa de inflagao e a variagao anual do IPC. A taxa de desemprego refere-se aos trabalhadores civis. 
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O modelo (6.7.5) mostra que, se a taxa de desemprego cair em media 1%, a taxa de 
inflafao registrar^ um aumento medio de cerca de 0,64 ponto percentual e vice-versa. O 
modelo (6.7.6) mostra que, mesmo se a taxa de desemprego aumentar indefinidamente, a 
infla^ao caira no maximo em torno de 3,07 pontos percentuais. E interessante observarmos 
que por meio da Equa^ao (6.7.5) podemos calcular a taxa natural de desemprego subja- 
cente como: 


U N 


-h 


3,7844 

0,6385 


5,9270 


(6.7.7) 


A taxa natural de desemprego e de cerca de 5,93%. Os economistas situam a taxa natural 
entre 5% e 6%, embora recentemente a taxa de desemprego vigente nos Estados Unidos 
tenha sido bem inferior. 
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FIGURA 6.10 

O modelo logaritmico 
recfproco. 


Y 



Modelo da hiperbole logantmica ou modelo recfproco logarftmico 

Concluiremos nossa discussao sobre os modelos recfprocos considerando o modelo recfproco loga¬ 
ritmico, que assume a seguinte forma: 


In Y, = fi x 



(6.7.8) 


Sua forma e apresentada na Figura 6.10. Como a figura mostra, inicialmente Y aumenta a uma 
taxa crescente (a curva e inicialmente convexa) e entao aumenta a uma taxa decrescente (torna-se 
concava). 24 Portanto, esse modelo pode ser adequado a uma fungao de produgao de curto prazo. 
Lembre-se da microeconomia que, se trabalho e capital sao os insumos em uma fungao de produgao 
e se o capital for mantido constante enquanto se aumenta a quantidade de trabalho, a relagao produto- 
-trabalho sera semelhante a Figura 6.10. (Veja o Exemplo 7.3 do Capitulo 7.) 


6.8 A escolha da forma funcional 

Neste capitulo discutimos as varias formas funcionais que um modelo pratico pode assumir, mesmo 
dentro dos limites dos modelos de regressao linear nos parametros. A escolha de uma forma funcional 
especifica e comparativamente simples no caso de duas variaveis, porque podemos representa-las 
graficamente e ter uma ideia aproximada do modelo adequado. A escolha toma-se muito mais complexa 
quando consideramos modelos de regressao multipla envolvendo mais de um regressor, como veremos 
ao tratar desse assunto nos proximos dois capftulos. 

Nao ha como negar que e necessario bastante conhecimento e experiencia para escolher o mode¬ 
lo adequado as estimativas empfricas. Mas e possfvel oferecer algumas orientagoes: 

1. A teoria subjacente (por exemplo, a curva de Phillips) pode sugerir uma forma funcional em 
particular. 

2. Uma boa pratica e descobrir a taxa de variagao (o coeficiente angular) do regressando em 
relagao ao regressor, bem como calcular a elasticidade do regressando em relagao ao regres¬ 
sor. Na Tabela 6.6 a seguir, fornecemos as formulas dos coeficientes angulares e de elastici¬ 
dade para os varios modelos apresentados neste capitulo. O conhecimento dessas formulas 
nos ajudara a comparar os varios modelos. 


24 Recorrendo ao calculo, podemos demonstrar que: 



Mas 


Fazendo essa substituigao, obtemos: 



1 dY 
YdX. 


dl = „ Y_ 

dX X 2 


que e o coeficiente angular de Y em relagao a X. 
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TABELA 6.6 


Modelo 

Linear 

Log-linear 

Log-1 in 
Lin-log 

Reciproco 
Log reciproco 


Equafao 

Y= ySi + Pi* 

In Y= /Si + >62 In X 

In Y= Pi + p 2 X 
Y= Pi + p 2 In X 

- ft (*) 


Coeficiente /_ dY\ 
angular ( dXJ 


Pi 




Pi (*)* 



Nota: o * indica que a elasticidade varia dependendo do valor assumido por X ou Y ou por ambos. Quando nao se especificam os valores de X e 
de Y , na pratica, muitas vezes essas elasticidades sao medidas pelos valores medios das variaveis, a saber ,X e Y. 


3. Os coeficientes do modelo escolhido devem satisfazer certas expectativas a priori. Se esti- 
vermos considerando a demanda por automoveis como fun 5 ao do pre£o e outras variaveis, 
deveriamos esperar um coeficiente negativo para a variavel prepo. 

4. As vezes, mais de um modelo pode ajustar-se muito bem a determinado conjunto de dados. 
No caso da curva de Phillips modificada, ajustamos os modelos linear e reciproco aos mes- 
mos dados. Nos dois casos, os coeficientes estavam de acordo com expectativas previas e 
eram estatisticamente significativos. Uma das principals diferenpas era que o valor de r 2 do 
modelo linear era maior que o do reciproco. Pode-se, portanto, dar preferencia ao primeiro. 
Mas ao comparar os dois valores de r 2 esteja certo de que a variavel dependente, ou regres- 
sando, dos dois modelos e a mesma; o(s) regressor(es) pode(m) assumir qualquerforma. No 
proximo capitulo, explicaremos a razao disso. 

5. Em geral, nao se deve dar excessiva importancia ao r 2 , no sentido de que, quanto mais ele- 
vado o r 2 , melhor o modelo. Como veremos no proximo capitulo, r 2 aumenta a medida que 
acrescentamos mais regressores ao modelo. Muito importante e a base teorica do modelo 
escolhido, os sinais dos coeficientes estimados e sua significancia estatistica. Se um modelo for 
bom segundo esses criterios, um r 2 menor pode ser aceitavel. Voltaremos a este topico rele- 
vante em mais detalhe no Capitulo 13. 

6 . Em algumas situa 5 oes, pode nao ser facil estabelecer uma forma funcional em particular, 
caso em que podemos usar as chamadas transforma 5 oes Box-Cox. Como e um topico bas- 
tante tecnico, discutiremos o procedimento Box-Cox no Apendice 6A.5. 


*6.9 Um comentario sobre a natureza do termo de erro estocastico: 
terrno aditivo versus termo multiplicativo 

Considere o seguinte modelo de regressao, que e igual a Equa 5 ao (6.5.1), exceto pela ausencia do 
termo de erro: 

Y = h X? 2 (6.9.1) 


Opcional 
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Para fins de cstimapao, podemos expressa-lo de tres maneiras diferentes: 


Yi = fhX^Ui 

(6.9.2) 

Yi = 

(6.9.3) 

Yt = frXf 2 + u, 

(6.9.4) 

Aplicando logaritmos nos dois lados dessas equa 5 oes, obtemos 

In Yj = a + P 2 InXj + lnw, 

(6.9.2 a) 

In Yj = a + P 2 ^nXj + m, 

(6.9.30) 

In Yi = In (P\Xf 2 + Ui ) 

(6.9.4o) 


em que a = In 

Modelos como a Equapao (6.9.2) sao modelos de regressao intrinsecamente linear (nos parame- 
tros ) no sentido de que, com a transforma 5 ao logarftmica adequada, podem ser transformados em 
modelos lineares nos parametros a e f} 2 ( Nota: esses modelos sao nao lineares em ft].) Mas o modelo 
(6.9.4) e intrinsecamente nao linear nos parametros. Nao ha um modo simples de aplicar os logaritmos 
da Equa^ao (6.9.4), porque In (A + B) ± In A + In B. 

Embora as Equa£oes (6.9.2) e (6.9.3) sejam modelos de regressao linear e possam ser estimados 
por minimos quadrados ordinarios (MQO) ou maxima vcrossimilhanpa (MV), devemos ter cuidado 
com as propriedades do termo de erro estocastico que entra nesses modelos. Lembre-se de que a 
propriedade de melhor estimador linear nao viesado do metodo de MQO exige que o valor da media 
de iij tenha media zero, variancia constante e autocorrela§ao nula. Para o teste de hipoteses supomos 
ainda que «, siga a distribu^ao normal com os valores da media e da variancia que acabamos de 
mencionar. Em resumo, supomos que m, ~ N( 0, a * 1 ). 

Considere agora o modelo (6.9.2). Sua contrapartida estatfstica e dada em (6.9.2a). Para usar o 
modelo classico de regressao linear normal (MCRLN), precisamos supor que: 

In Uj ~ N( 0, a 2 ) (6.9.5) 

Quando calculamos a regressao (6.9.2a), temos de aplicar os testes de normalidade discutidos no 
Capitulo 5 aos resfduos da regressao. Note que, se In u, segue a distribu^ao normal com media zero 
e variancia constante, a teoria estatfstica mostra que u, na Equa£ao (6.9.2) deve seguir a distribui^ao 
log-normal, com media e ff2/2 e variancia e al (e nl — 1). 

Como a analise anterior mostra, e preciso estar muito atento ao termo de erro ao transformar um 
modelo para fins de analise de regressao. Quanto a Equapao (6.9.4), trata-se de um modelo de regres¬ 
sao nao linear nos parametros e devera ser resolvido por alguma rotina computacional iterativa. O 
modelo (6.9.3) nao deve apresentar problemas de estima^ao. 

Em resumo, preste muita atencao ao termo de erro quando transformar um modelo para a analise 
de regressao. Caso contrario, uma aplica^ao as cegas de MQO ao modelo transfonnado nao resultara 
em um modelo com as propriedades estatfsticas desejaveis. 


Resumo e 
conclusoes 


Este capitulo apresentou varios detalhes do modelo classico de regressao linear. 

1. As vezes, um modelo de regressao nao contem um termo de intercepto explfcito. Estes sao chama- 

dos de modelos de regressao que passa pela origem. Embora a algebra de sua estima 5 ao seja 
simples, tais modelos devem ser usados com cautela. A soma de seus resfduos w, e diferente de 
zero, alem disso, o r 2 calculado da maneira convencional pode nao fazer muito sentido. A menos 
que exista uma forte razao teorica, e preferfvel introduzir o termo de intercepto explicitamente no 
modelo. 
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EXERCICIOS 


2. As unidades e a escala em que expressamos o regressando e o(s) regressor(es) sao muito impor- 
tantes, porque a interpreta£ao dos coeficientes de regressao depende fundamentalmente deles. Na 
pratica, o pesquisador deve nao so citar as fontes dos dados, mas tambem mostrar explicitamente 
como as variaveis sao medidas. 

3. A forma funcional da rela£ao entre regressando e regressor(es) e igualmente importante. Algumas 
formas funcionais relevantes discutidas neste capftulo sao: (a) o modelo log-linear ou de elastici- 
dade constante; ( b ) os modelos de regressao semilogaritmicos; e (c) os recfprocos. 

4. No modelo log-linear tanto o regressando quanto o(s) regressor(es) sao expressos em forma loga- 
ritmica. O coeficiente de regressao correspondente ao logaritmo de urn regressor e interpretado 
como a elasticidade do regressando em rela£ao ao regressor. 

5. No modelo semilogantmico, ou o regressando ou o(s) regressor(es) esta(ao) em forma logarftmica. 
No modelo semilogantmico em que o regressando e logarftmico e o regressor leo tempo, o 
coeficiente angular estimado (multiplicado por 100) mede a taxa de crescimento (instantaneo) 
do regressando. Esses modelos sao usados com frequencia para medir a taxa de crescimento dos 
fenomenos economicos. No modelo semilogantmico em que o regressor e logaritmico, seu coefi¬ 
ciente mede a taxa de vari agao absoluta do regressando para uma dada variagao percentual no 
valor do regressor. 

6. Nos modelos recfprocos, ou o regressando ou o regressor e expresso em forma recfproca, ou in- 
versa, para capturar as redoes nao lineares entre variaveis economicas, como no caso da famosa 
curva de Phillips. 

7. Ao escolher as varias formas funcionais, deve-se dar grande aten 9 ao ao termo de erro estocastico 
Uj. Como observado no Capftulo 5, o modelo classico de regressao linear assume explicitamente 
que o termo de erro apresenta media igual a zero, variancia constante (homocedastica) e nao e 
correlacionado ao(s) regressor(es). E sob essas hipoteses que os estimadores de minimos quadra- 
dos ordinarios sao o melhor estimador linear nao viesado. Alem disso, no modelo classico de re¬ 
gressao linear normal, os estimadores de MQO tambem estao normalmente distribuidos. E preciso 
verificar se essas hipoteses sustentam-se na forma funcional escolhida para a analise empirica. 
Depois de estimar a regressao, o pesquisador precisa aplicar testes de diagnostico, como o teste 
de normalidade discutido no Capftulo 5. Esse ponto e de maxima importancia, pois os testes de 
hipotese classicos, como of, o Fe/, baseiam-se na hipotese de normalidade do termo de erro. 
Isso e especialmente critico se o tamanho da amostra for pequeno. 

8. Embora a discussao ate o momento tenha limitado-se aos modelos de regressao com duas 
variaveis, os proximos capftulos mostrarao que, em muitos casos, a extensao para modelos de 
regressao multipla envolve apenas mais algebra sem necessariamente incluir mais conceitos fun¬ 
damentals. E por isso que e tao importante que o leitor domine o modelo de regressao de duas 
variaveis. 


6.1. Considere o seguinte modelo de regressao: 

y, = P\ + P2X1 + 

em que y t = ( Y t — Y) e x, = (X, —X). Neste caso, a linha de regressao deve passar pela origem. 
Verdadeiro ou falso? Mostre seus calculos. 

6.2. Os seguintes resultados de uma regressao tomaram como base dados mensais do periodo janeiro 
de 1978 a dezembro de 1987: 


Y, = 0,00681 

+ 0,75 8 \5X, 

ep= (0,02596) 

(0,27009) 

t= (0,26229) 

(2,80700) 

valor p = (0,7984) 

(0,0186) r 2 = 0,4406 
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Y, = 0,76214V, 
ep = (0,265799) 
t= (2,95408) 


valor p = (0,0131) 


r 2 = 0,43684 


em que Y = taxa mensal de retorno das agoes ordinarias da Texaco, em %, e X = taxa mensal 

de retorno do mere ado, em %.* 

a. Qual a diferenga entre os dois modelos de regressao? 

b. Dados os resultados obtidos, voce manteria o termo de intercepto no primeiro modelo? Justi- 
fique sua resposta. 

c. Como interpretar os coeficientes angulares dos dois modelos? 

d. Qual a teoria que embasa os dois modelos? 

e. Voce pode comparer os r 2 dos dois modelos? Justifique. 

f. A estatfstica Jarque-Bera de normalidade para o primeiro destes modelos e igual a 1,1167 
e para o segundo modelo, 1,1170. Que conclusoes voce pode tirar dessas estatisticas? 

g. O valor t do coeficiente angular do modelo com intercepto zero e de cerca de 2,95, enquanto 
o do modelo com intercepto presente e de 2,81. Ha alguma logica por tras desse resultado? 

6.3. Considere o seguinte modelo de regressao: 



Nota: nem Y nem X assumem valor zero. 

a. E um modelo de regressao linear? 

b. Como voce estimaria este modelo? 

c. O que ocorre com Y quando X tende ao infinito? 

d. Voce pode dar um exemplo em que este tipo de modelo seria adequado? 

6.4. Considere o seguinte modelo log-linear: 


In Yi= p x + p 2 In X t + u, 


Represente graficamente as curvas que mostram a relagao entre Y (no eixo vertical) e X (no 
eixo horizontal) quando f5 2 = 1, P 2 > 1 e Pi < 1- 

6.5. Considere os modelos: 


Modelo I: }) — "t" 

Modelo II: Y* = a\ + oilX* + w, 


em que Y* e X* sao variaveis padronizadas. Mostre queo :2 =Pi (5\/.S' v ) e, portanto, estabeleca 
que, embora os coeficientes angulares da regressao sejam independentes da mudanqa da ori- 
gem, nao sao independentes da mudanca de escala. 

6.6. Considere os seguintes modelos: 


In Y* = a\ + a 2 In X* + u* 
In Yi — /3\ + (fi In X, + u / 


em que y*=w 1 4)eV* = w 2 X h sendo os w constantes. 


a. Estabelega as relagoes entre os dois conjuntos de coeficientes de regressao e seus erros 
padrao. 

b. Ha diferenga entre os r 2 dos dois modelos? 


Os dados basicos foram extrafdos do disquete de dados que acompanha BERNDT, Ernst R. The pratice of 
econometrics: classic and contemporary. Reading, Mass.: Addison-Wesley, 1991. 
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6.7. Entre as regressoes (6.6.8) e (6.6.10), qual dos modelos voce prefere? Por que? 

6.8. Para a regressao (6.6.8), teste a hipotese de que o coeficiente angular nao difere significativa- 
mente de 0,005. 

6.9. Com base na curva de Phillips da Equa§ao (6.7.3), e possivel estimar a taxa natural de desem- 
prego? Como? 

6.10. A curva de despesas de Engel relaciona as despesas de um consumidor com um bem a sua 
renda total. Sendo Y = despesas de consumo com um bem e X = renda do consumidor, consi- 
dere os seguintes modelos: 


Yi = 

(h + 

fcXi + M, 

Yt = 


hQIXi) + M, 

In Y t = 

ln/?i 

+ ft2 In Xj + itj 

In 7 , = 

ln/fi 

+ /I 2 (l IXi) + u, 

Yi = 

A + 

P2 In Xi + Uj 


Qual desse(s) modelo(s) voce escolheria para representar a curva de despesas de Engel e por 
que? ( Dica: interprete os varios coeficientes angulares, descubra as expressoes da elasticidade 
das despesas em rela§ao a renda etc.) 

6.11. Considere o seguinte modelo: 

eft + 

v = _ 

1 i + 

Trata-se de um modelo de regressao linear? Em caso negativo, que “truque” voce pode usar 
para transforma-lo em um modelo de regressao linear? Como voce interpretaria o modelo re- 
sultante? Sob que circunstancias seria adequado usa-lo? 

6.12. Represente graficamente os seguintes modelos (para facilitar, omitimos o subscrito i da varia- 
vel): 

a. Y - para /J 2 > 1 , Pi = 1, 0 < fi 2 < 1, ... 

b. Y = para /3 2 > 0 e /S 2 < 0. 

Explique em que casos seria adequado o uso desses modelos. 

6.13. Considere a seguinte regressao:* 

ISP, = - 17,8 + 33,2 Gini, 
ep = (4,9) (11,8) r z = 0,16 

Em que ISP = Indice de instabilidade sociopolftica, media para o perfodo 1960-1985 e Gini = 
coeficiente Gini para 1975 ou o ano mais proximo dentro do periodo 1970-1980. A amostra 
consiste em 40 pafses. 

O coeficiente Gini e uma medida de desigualdade de renda e situa-se entre 0 e 1. Quanto 
mais proximo de 0, maior a igualdade de renda e, quanto mais proximo de 1, maior a desigual¬ 
dade de renda. 

a. Como voce interpreta esta regressao? 

b. Suponha que o coeficiente Gini aumente de 0,25 para 0,55. Em quanto o ISP aumentara? 

c. O coeficiente angular e estatisticamente significativo no nivel de 5%? Demonstre os calcu- 
los necessarios. 

d. Com base na regressao anterior, e possivel argumentar que os pafses com maior desigual¬ 
dade de renda sao politicamente instaveis? 


Veja WEIL, David N. Economic growth. Boston: Addison Wesley, 2005. p. 392. 
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TABELA 6.7 


TABELA 6.8 


Exercicios aplicados 


6.14. Com base na Tabela 6.7 ajuste o seguinte modelo aos dados e obtenha as estati'sticas de regres¬ 
sao habituais. Interprete os resultados. 


100 

100 - Yj 




Yi 

86 

79 

76 

69 

65 

62 

52 

51 

51 

48 

Xi 

3 

7 

12 

17 

25 

35 

45 

55 

70 

120 


6.15. Para estudarem a relayao entre taxa de investimento (despesas com investimento como uma 
proporpao do PIB) e a taxa de poupan 5 a (poupan 9 a como uma propor 9 ao do PIB), Martin 
Feldstein e Charles Horioka obtiveram dados para uma amostra de 21 pafses (veja a Tabela 
6.8). A taxa de investimento para cada pals e a taxa media para o perfodo 1960-1974 e a taxa 
de poupan 5 a e a taxa media de poupan 9 a para o mesmo perfodo. A taxa de investimento e re- 
presentada pela variavel Taxainv e a taxa de poupan 9 a pela variavel Taxapoup. 1 

a. Represente graficamente a rela 9 ao entre taxa de investimento e taxa de poupan 9 a. 

b. Com base neste grafico, voce acha que os modelos a seguir se ajustam-se igualmente bem 
aos dados? 


Taxainv, = P\ + fto Taxapoup, + u. 

In Taxainv, = aq + a 2 In Taxapoup, + u. 



TAXAINV 

TAXAPOUP 

Australia 

0,250 

0,270 

Austria 

0,285 

0,282 

Belgica 

0,235 

0,224 

Canada 

0,219 

0,231 

Dinamarca 

0,202 

0,224 

Finlandia 

0,288 

0,305 

Franga 

0,254 

0,260 

Alemanha 

0,271 

0,264 

Grecia 

0,219 

0,248 

Irlanda 

0,190 

0,218 

Italia 

0,235 

0,224 

Japao 

0,372 

0,368 

Luxemburgo 

0,313 

0,277 

Holanda 

0,273 

0,266 

Nova Zelandia 

0,232 

0,249 

Noruega 

0,278 

0,299 

Espanha 

0,235 

0,241 

Suecia 

0,241 

0,242 

Suifa 

0,297 

0,297 

Reino Unido 

0,184 

0,192 

Estados Unidos 

0,186 

0,186 


Nota: TAXAINV = investimento como uma proporgao do PIB. 


TAXAPOUP = poupanga como uma proporgao do PIB. 


Adaptado de JOHNSTON, J. Econometric methods. 3. ed. Nova YorK: McGraw-Hill, 1984. p. 87. Na verdade, 
estes dados foram extrafdos de uma prova de econometria da Universidade de Oxford, de 1975. 
f FELDSTEIN, Martin; HORIOKA, Charles. "Domestic saving and international capital flows. Economic Journal. Jun. 
1980. v. 20, p. 314-329. Dados reproduzidos de MURRAY, Michael P. Econometrics: a modern introduction. 
Boston: Addison Wesley, 2006. 
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c. Calcule ambos os modelos e obtenha as estatfsticas habituais. 

d. Como voce interpretaria o coeficiente angular no modelo linear? E no modelo log-linear? 
Existe alguma diferenpa nas interpretapoes? 

e. Como voce interpretaria os interceptos dos dois modelos? Existe alguma diferen 9 a nas in- 
terpreta 9 oes? 

/. Ha alguma diferen 9 a entre os coeficientes r 2 ? Por que ou por que nao? 

g. Suponha que voce queira calcular a elasticidade da taxa de investimento em rela 9 ao a taxa de 
poupan 9 a. De que maneira voce obtem a elasticidade para o modelo linear? E para o modelo 
log-linear ? Note que a elasticidade e definida como a varia 9 ao porcentual na taxa de investi¬ 
mento para uma varia 9 ao percentual na taxa de poupan 9 a. 

h. Dados os resultados dos dois modelos de regressao, qual deles voce prefere? Por que? 

6.16. A Tabela 6.9* apresenta as definipoes de variaveis para diversos tipos de despesas, despesas 
totais, renda, idade do chefe da familia e niimero de filhos para uma amostra de 1.519 famllias 
extraidas do British Family Expenditures Surveys (Censo das Despesas Familiares na Inglater- 
ra) no perfodo 1980-1982. 

Os dados amostrais estao disponlveis no site deste livro. Eles incluem apenas familias com um 
ou mais filhos que residem na Grande Londres. A amostra nao inclui famllias cujo chefe e 
autonomo ou aposentado. 

a. Usando os dados sobre despesas com alimenta 9 ao em rela 9 ao a despesas totais, determine 
qual dos modelos resumidos na Tabela 6.6 e adequado aos dados. 

b. Com base nos resultados da regressao obtidos em (a) qual modelo parece mais apropriado a 
situa 9 ao presente. 

Nota: guarde os dados para uma analise futura no proximo capftulo sobre regressao multipla. 

6.17. Consulte a Tabela 6.3. Verifique qual e a taxa de crescimento das despesas com bens duraveis. 
Qual a semielasticidade estimada? Interprete os resultados. Faria sentido estimar uma regres¬ 
sao log-log tendo como regressando a despesa com bens duraveis e o tempo como regressor? 
Como voce interpretaria o coeficiente angular neste caso? 

6.18. Com os dados da Tabela 6.3 calcule a taxa de crescimento das despesas com bens nao duraveis 
e compare esses resultados com os obtidos no Exercfcio 6.17. 


TABELA 6.9 


Lista de variaveis: 


waliment = 
wcombust = 
wvest = 
wale = 
wtrans = 
desptot = 

renda = 


idade = 
nf = 


parcela do or 9 amento para despesas com alimentagao 
parcela do or 9 amento para despesas com combustivel 
parcela do o^amento para despesas com vestuario 
parcela do orfamento para despesas com alcool 
parcela do or 9 amento para despesas com transporte 
despesa total do domicilio 

(arredondada para a dezena mais proxima de libras esterlinas) 
renda liquida total do domicilio 

(arredondada para a dezena mais proxima de libras esterlinas) 
idade do chefe da familia 
numero de filhos 


A parcela no or 9 amento de um bem, por exemplo, alimentagao e definica como: 

„ despesas com alimentacao 

waliment = - 1 — ; - 

despesas totals 


Os dados sao de BLUNDELL, Richard; PENDAKUR, Krishna. "Semiparametric estimation and consumer demand." 
lournal of Applied Econometrics, 1998. v 13, n. 5, p. 435-462. Dados reproduzidos de HILL, R. Carter; GRIFFITHS, 
William E.; JUDGE, George G. Undergraduate econometrics. 2. ed. Nova York: John Wiley & Sons, 2001. 






Capftulo 6 Extensoes do modelo de regressao linear de duas variaveis 197 


6.19. A Tabela 6.10 fornece dados sobre despesas totals de consumo (em milhoes de libras) e despe- 

sas com publicidade (em milhoes de libras) para 29 categorias de produtos no Reino Unido. 

a. Considerando as varias formas funcionais que abordamos no capftulo, qual delas ajusta-se 
ao dados fornecidos na Tabela 6.10? 

b. Estime os parametros do modelo de regressao escolhido e interprete seus resultados. 

c. Tomando a razao das despesas com publicidade em rela£ao as despesas totais de consumo, 
o que voce observa? Ha alguma categoria de produto para a qual esta razao e excepcional- 
mente alta? Existe algo de especial sobre essas categorias de produtos que possa explicar a 
despesa relativamente alta com publicidade? 

6.20. Consulte o Exemplo 3.3 no Capftulo 3 para responder o seguinte: 

a. Represente graficamente a demanda por telefones celulares em relapao a renda per capita 
ajustada pela paridade do poder de compra. 

b. Represente graficamente o log da demanda por telefones celulares em relapao ao log da 
renda per capita. 

c. Qual a diferenpa entre os dois graficos? 


TABELA 6.10 

Despesas com 
publicidade e 
despesas totais (em 
milhoes de libras) 
para 29 categorias de 
produtos no Reino 
Unido 


Obs 

DESPUB 

DESCON 

RAZAO 

1 

87957,00 

13599,00 

0,006468 

2 

23578,00 

4699,000 

0,005018 

3 

16345,00 

5473,000 

0,002986 

4 

6550,000 

6119,000 

0,001070 

5 

10230,00 

8811,000 

0,001161 

6 

9127,000 

1142,000 

0,007992 

7 

1675,000 

143,0000 

0,011713 

8 

1110,000 

1 38,0000 

0,008043 

9 

3351,000 

85,00000 

0,039424 

10 

1140,000 

108,0000 

0,010556 

11 

6376,000 

307,0000 

0,020769 

12 

4500,000 

1545,000 

0,002913 

13 

1899,000 

943,0000 

0,002014 

14 

10101,00 

369,0000 

0,027374 

15 

3831,000 

285,0000 

0,01 3442 

16 

99528,00 

1052,000 

0,094608 

17 

15855,00 

862,0000 

0,018393 

18 

8827,000 

84,00000 

0,105083 

19 

54517,00 

11 74,000 

0,046437 

20 

49593,00 

2531,000 

0,019594 

21 

39664,00 

408,0000 

0,097216 

22 

327,0000 

295,0000 

0,001108 

23 

22549,00 

488,0000 

0,046207 

24 

416422,0 

19200,00 

0,021689 

25 

14212,00 

94,00000 

0,151191 

26 

541 74,00 

5320,000 

0,010183 

27 

20218,00 

357,0000 

0,056633 

28 

11041,00 

159,0000 

0,069440 

29 

22542,00 

244,0000 

0,092385 


Fonte: http://www.economicswebinstitute.org/ecdata.htm. 


DESPUB = despesa com publicidade (£, milhoes) 
DESCON = despesa total de consumo (£, milhoes) 


Estes dados sao do Advertising Year Book, 1996. Disponiveis em: http://www.economicswebinstitute.org/ 
ecdata.htm. 
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d. Com base nesses graficos, voce acredita que um modelo log-log pode ajustar-se melhor aos 
dados do que um modelo linear? Estime o modelo log-log. 

e. Como voce interpreta o coeficiente angular no modelo log-log? 

/. O coeficiente angular estimado no modelo log-log e estatisticamente significativo no nivel 
de 5%? 

g. Como voce estimaria a elasticidade da demanda por telefones celulares em relagao a renda 
para o modelo linear da Equagao (3.7.3)? De que informagoes adicionais voce precisa? 
Chame a elasticidade ajustada de elasticidade da renda. 

h. Existe alguma diferenga entre a elasticidade da renda estimada no modelo log-log e a esti- 
mada no modelo linear? Se houver, qual modelo voce escolheria? 

6.21 Repita o Exerclcio 6.20, mas consulte a demanda por computadores pessoais fornecida na 
Equagao (3.7.4). Existe alguma diferenga entre as elasticidades da renda estimadas para tele¬ 
fones celulares e computadores pessoais? Se houver, que fatores podem responder pela dife¬ 
renga? 

6.22 Consulte os dados da Tabela 3.3. Para descobrir se pessoas que possuem PC tambem possuem 
telefone celular, calcule a seguinte regressao: 

Telcel, = /Ji + /fiPC, + m, 

a. Estime os parametros desta regressao. 

b. O coeficiente angular estimado e estatisticamente significativo? 

c. Faz diferenga se voce calcular a seguinte regressao? 

PC, = a i + a 2 Telcel, + u t 

d. Calcule a regressao anterior e teste o significado estatistico do coeficiente angular estimado. 

e. Baseado em que voce decidiria entre usar a primeira e a segunda regressao? 


Apendice 6A 


6A.1 Derivafao de estimadores de rmnimos quadrados 
para regressoes que passam pela origem 


Desejamos minimizar 

£*? = - A *-) 2 

em relagao a 

Diferenciando (1) em relagao a fa, obtemos: 


d$ 2 


2 £(r, - PifaX-Xi) 


Igualando a Equagao (2) a zero e simplificando, obtemos: 


Pi 


E x i y i 

T,xf 


Agora, substituindo a FRP: Y t = faX t + u t nesta equagao, obtemos: 


( 1 ) 


( 2 ) 


(6.1.6) = (3) 


Pi 


T.XiipiXj + «,■) 

Zxf 


- p2 + 


EXjUi 

12 xj 


( 4 ) 
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( Nota: E(p 2 ) = P 2 ) Portanto, 


E <$2 - Pi) 2 = E 


' T.x.u , ! 2 
. Ex? . 


(5) 


Expandindo o lado direito da Equagao (5) e observando que os X t sao nao estocasticos e os m, sao homocedas- 
ticos e nao correlacionados, obtemos: 

var (Pi) = E0 2 ~ Pi) 2 = (6.1.7) = (6) 

Note que por meio da Equagao (2), obtemos, depois de iguala-la a zero, 

E“‘ X « = 0 (7) 

Na Segao 3A. 1 do Apendice 3 A. vimos que, quando o termo de intercepto esta presente no modelo, temos, alem 
de (7), a condigao 53 w, = 0. Com base na matematica que acabamos de ver deve ficar claro por que no mode¬ 
lo de regressao que passa pela origem a soma dos erros, 53 pode nao ser igual a zero. 

Suponha que queremos irnpor a condigao de que “i = 0. Neste caso, teriamos 


T, Y i = PiJ2 x ‘ + E fi - 


= AE Xi , como Eti, = 0 por construgao 


Esta expressao nos da, entao, 


Pl = 


EYi 

Ex, 


Y valor medio de Y 
X valor medio de X 


( 8 ) 


(9) 


Mas esse estimador nao e o mesmo que a Equagao (3) ou a Equagao (6.1.6). E, como o ft 2 da Equagao (3) nao 
e viesado (por que?), o 2 da Equagao (9) nao pode ser nao viesado. 

O surpreendente e que, nas regressSes que passam pela origem, nao podemos ter simultaneamente J2 UiXi 
e E^i iguais a zero, como no modelo convencional de regressao. A unica condigao que se sustenta e que 
u i Xi e igual a zero. 

Lembre-se de que: 

Y, = % + ut (2.6.3) 

Somando os dois lados dessa equagao e dividindo por N, o tamanho da amostra, obtemos: 

F= Y+ l ( 10 ) 

Como no modelo com intercepto igual a zero 53 «; e portanto, nao precisam ser zero, segue-se que: 

Y^Y ( 11 ) 


isto e, a media dos valores efetivos de Y nao precisa ser igual a media dos valores estimados de Y; as duas me- 
dias sao identicas no caso do modelo em que o intercepto esta presente, como se ve na Equagao (3.1.10). 

Ja mencionamos que, no modelo com intercepto zero, r 2 pode ser negativo, enquanto no modelo conven¬ 
cional, ele nunca pode ser. Essa condigao pode ser demonstrada como a seguir. 

Usando a Equagao (3.5.5a), podemos escrever 


2 SQR E«[ 
STQ 53 yf 


( 12 ) 


Agora, no modelo convencional, ou com o intercepto presente, a Equagao (3.6.6) mostra que 


sqr = e «? = E yf ~ ft E x f s E x c 13 ) 

a menos que fa seja zero ( X nao influencie Y de fonna alguma). No modelo convencional, SQR < STQ ou r 
nunca pode ser negativo. 
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Para o modelo com intercepto zero, pode-se demonstrar analogamente que 


SQR = £«; = I> 2 " & 2 I> 


( 14 ) 


( Nota: as somas dos quadrados de Y e X nao sao ajustadas a media.) Nao ha garantia de que essa SQR sera 


sempre menor que Hy} ~ H Y 2 ~ NY 2 (a STQ), o que sugere que a SQR pode ser maior que a STQ impli- 


cando que r 2 , tal como convencionalmente definido, pode ser negativo. Note que nesse caso a SQR sera maior 


que a STQ se ft £ X 2 < NY 2 . 

6A.2 Demonstra^ao de que uma variavel padronizada tern 
media zero e variancia igual a um 


Considere a variavel aleatoria Y com valor medio (amostral) de Y e desvio padrao (amostral) de S y . Definindo 



(15) 


Portanto, Y; e uma variavel padronizada. Note que a padronizagao envolve uma operagao dupla: (1) mudanga 
da origem, que e o numerador da Equagao (15); e (2) mudanga da escala, que e o denominador. Assim, a padro- 
nizagao envolve tanto uma mudanga da origem, quanto da escala. Agora 


Dado que a soma dos desvios de uma variavel em relagao a seu valor medio e sempre igual a zero. Portanto, a 
media do valor padronizado e zero. (Nota: podemos excluir o termo S y da somatoria porque seu valor e conhe- 
cido.) Agora, 



(17) 


(n - 1)S 2 
(n - 1)5 2 


Note que 


, 2 _ UY, - Y) 2 


que e a variancia amostral de Y. 


6A.3 Logaritmos 


Considere os numeros 5 e 25. sabemos que 


(18) 


Dizemos que o expoente 2 e o logaritmo de 25 para a base 5. Mais formalmente, o logaritmo de um numero 
(por exemplo, 25) para determinada base (por exemplo, 5) e a potencia (2) a qual a base (5) deve ser elevada 
para obter essa dado numero (25). 

De modo mais geral, se 


Y= b x (b> 0) 


(19) 


entao 


\og h Y= X 


( 20 ) 
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Em matematica, a fungao (19) e chamada defungao exponential e a fungao (20) de fungao logaritmica. Como 
ficou claro nas Equagdes (19) e (20), uma fungao e o inverso da outra. 

Embora qualquer base (positiva) possa ser usada, na pratica, as duas bases mais comumente usadas sao 10 
e o numero matematico e = 2,71828.... 

Logaritmos de base 10 sao chamados de logaritmos comuns. Assim, 

log 10 100= 2 log 10 30 = 1,48 

isto e, no primeiro caso, 100 = 10 2 e no segundo 30 ~ 10 1 ’ 48 

Logaritmos na base e sao chamados de logaritmos naturals. Assim, 
log c 100 = 4,6051 e log e 30 = 3,4012 

Todos esses calculos podem ser feitos rotineiramente em uma calculadora. 

Por convengao, o logaritmo na base 10 e denotado por log e na base e por In 
escrever log 100 ou log 30 ou In 100 ou In 30. 

Ha uma relagao fixa entre o log comum e o log natural, que e 

\w X = 2,3026 log A 

O log natural para o numero X e igual a 2,3026 vezes o log X na base 10. Assim, 

In 30 = 2,3026 log 30 = 2,3026(1.48) = 3,4012 (aprox.) 

como antes. Portanto, nao importa se usamos log comum ou natural. Mas em matematica, a base preferida e a 
e, o logaritmo natural. Todos os logs usados neste livro sao naturais, a menos que explicitado de maneira dife- 
rente. Obviamente, podemos converter o log de um numero de uma base para a outra usando a Equagao (21). 

Tenha em mente que logaritmos de numeros negativos nao sao definidos. Portanto, o log de (-5) ou o In de 
(-5) nao e definido. 

Algumas propriedades dos logaritmos: s e A e B sao numeros positivos quaisquer, podemos demonstrar 


que: 

1. In (A X B) = In A + In B (22) 

O log do produto de dois numeros (positivos) e igual a soma de seus logs. 

2. In ( A/B) = In A - In B (23) 

O log da razao de dois numeros (positivos) e igual a diferenqa de seus logs. 

3 \n(A ± B) ^ In A ± ln5 (24) 

O log da soma ou da diferenqa de A e B nao e igual a soma ou a diferenja de seus logs. 

4. In (4*) = k In A (25) 

O log de A elevado a potencia k e igual a k multiplicado pelo log de A. 

5. In e = 1 (26) 

O log de e tendo ele mesmo como base e igual a 1 (assim como o log de 10 na base 10). 

6. In 1 = 0 (27) 

O log natural do numero 1 e zero (assim como o log comum do numero 1). 

7. Se T = In X, 

dY _ 1 

dX X (28) 


A taxa de mudanfa (ou seja, a derivada) de Y em relagao a X e 1 sobre X. As fungoes logaritmicas exponen- 
ciais (e naturais) estao na Figura 6A.1. 


. No exemplo anterior, podemos 


( 21 ) 
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FIGURA 6A.1 

Fungoes exponencial 
e logarftmica: (a) 
fungao exponencial 
( b ) fungao logarftmica. 




Embora o numero para o qual se obtem o log seja sempre positivo, o logaritmo deste numero pode ser 
tanto positivo quanto negativo. E possivel verificar facilmente que se 

0 < 7 < 1 entao ln7 < 0 
7 = 1 entao ln7 = 0 
Y > 1 entao In 7 > 0 


Note tambem que, embora a curva logarftmica da Figura 6A. 1 (b) tenha inclinagao positiva, implicando que 
quanto maior o numero, maior sera seu logaritmo, a curva aumenta em uma razao decrescente (matematica- 
mente, a segunda derivada da fungao e negativa). Assim, ln(10) = 2,3026 (aprox) e ln(20) = 2,99576 (aprox). 
Se um numero e dobrado, seu logaritmo nao dobra. 

E por essa razao que a transformagao logantmica e chamada de nao linear. Tal fato tambem pode ser visto 
por meio da Equagao (28), que ressalta que se 7 = In X , dXIdX = 1/A. Isso significa que a inclinagao da fungao 
logarftmica depende do valor de X; ou seja, nao e constante (lembre-se da definigao de linearidade na variavel). 

Logaritmos e porcentagens : como = ^, ou c?(ln X) = ‘^y, para variagoes muito pequenas, a varia- 

gao em In X e igual a variagao relativa ou proporcional em X. Na pratica, se a variagao em X e razoavelmente 
pequena, essa relagao pode ser escrita como a variagao em In X & a variagao relativa em X, em que ^ significa 
aproximadamente. 

Para variagoes pequenas, 


(In X, 


In X, 0 = 


(Xt_ X,-d 

X,-i 


variagao relativa em A 


6A.4 Formulas de taxa de crescimento 


Seja a variavel 7 uma fungao de tempo 7 = f(t), em que t denota o tempo. A taxa instantanea (por exemplo, 
um ponto no tempo) de crescimento de 7, g Y e definida como 

_ dY/dt _ 1 dY 

8Y ~ ~^T ~ Y~dt (29) 

Note que, se multiplicarmos g Y por 100, obteremos a taxa percentual de crescimento, em que - e a taxa de 
variagao de 7 em relagao ao tempo. 

Agora, seja In 7= In f(f), em que In representa o logaritmo natural, entao 

d In7 _ 1 dY ( 3{) ^ 

dt Y dt 

Isso e igual a Equagao (29). 

Portanto, transformagoes logarftmicas sao muito uteis para calcular taxas de crescimento, especialmente se 
7 for uma fungao de outras variaveis dependentes do tempo, como o exemplo a seguir mostrara. Seja 


7 = A- Z 


(31) 
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em que Feo PIB nominal, X o PIB real eZeo deflator de prego (do PIB). Em palavras, o PIB nominal e o PIB 
real multiplicado pelo deflator de prego (do PIB). Todas essas variaveis sao tirades de tempo, ja que variam ao 
longo do tempo. 

Agora aplicando logs na Equagao (31) obtemos: 


(32) 


In Y= lnX + InZ 


Derivando a Equagao (32) em relagao ao tempo, obtemos 


1 dY 1 dX 1 dZ 



(33) 


Y dt X dt Z dt 


ou seja, g Y = g x + gz, em flue g denota a taxa de crescimento. 

Em palavras, a taxa instantanea de crescimento de Y e igual a soma da taxa instantanea de crescimento de 
X com a taxa instantanea de crescimento de Z. Neste exemplo, a taxa instantanea de crescimento do PIB nomi¬ 
nal e igual a soma da taxa instantanea de crescimento do PIB real com a taxa instantanea de crescimento do 
deflator de prego do PIB. 

De modo mais geral, a taxa instantanea de crescimento de um produto e a soma das taxas instantaneas de 
crescimento de seus componentes. Isso pode ser generalizado para o produto de mais de duas variaveis. 

De maneira semelhante, se tivermos 



(34) 


1 dY _ 1 dX 1 dZ 
Y dt X dt Z dt 


(35) 


ou seja, gy = gx ~ 8z- Em outras palavras, a taxa instantanea de crescimento Y e igual a diferenga entre a taxa 
instantanea de crescimento de X e a taxa instantanea de crescimento de Z. Se Y = renda per capita, X = PIB e Z = 
populagao, a taxa instantanea de crescimento da renda per capita e igual a taxa instantanea de crescimento do PIB 
menos a taxa instantanea de crescimento da populagao. 

Agora, seja Y= X + Z. Qual a taxa de crescimento de 7? Seja Y = emprego total, X = empregos na produgao 
e Z = empregos administrativos. Como 


ln(X + Z)^lnX+ In Y, 


nao e facil calcular a taxa de crescimento de Y, mas com alguma algebra, podemos demonstrar que 



Z 




(36) 


A taxa de crescimento de uma soma e a media ponderada das taxas de crescimento de seus componentes. 
Por exemplo, a taxa de crescimento do emprego total e a media ponderada das taxas de crescimento de empre¬ 
gos na produgao e empregos administrativos, sendo os pesos a parcela de cada componente no emprego total. 


6A.5 O modelo de regressao Box-Cox 


Considere o seguinte modelo de regressao 

7/’ = fi] + p 2 Xi + u t Y > 0 


(37) 


em que A. (a letra grega lambda) e um parametro, que pode ser negativo, zero ou positivo. Como Y esta elevado 
a potencia A, teremos varias transformagoes de Y, dependendo do valor desse parametro. 

A Equagao (37) e conhecida como modelo de regressao Box-Cox, em homenagem aos estatfsticos Box e 


Cox. 1 Dependendo do valor de A, temos os seguintes modelos de regressao, apresentados na tabela a seguir: 


l 


BOX, G. E. P.; COX, D. R. "An analysis of transformations." lournai of the Royal Statistical Society, 1964. B26, p. 
211-243. 
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Valor de X 

Modelo de regressao 

1 

Yj = p-\ + @2 Xi + u, 

2 

Yf = p-\ + p2 Xj + u. 

0,5 

VYi = + ^2 , + u, 

0 

In Yj = /6i + P2X1 + Ui 

1 

—= = fi 1 + p 2 %i + ui 

sJYj 

TT = Pi + 02 + Uj 

1 i 

-0,5 

-1,0 


Como voce pode ver, os modelos linear e log-linear sao casos especiais na famflia de transforma§oes Box- 
-Cox. 

Obviamente, podemos aplicar essas transformat^des as variaveis X tambem. E interessante notar que quan- 
do A e zero, obtemos a transformagao log de Y. A demonstrajao disso e um tanto complexa e e melhor deixa-la 
para as consultas. (Leitores que apreciam calculo deverao recordar a regra do l’Hopital.) 

Mas de que maneira determinamos o valor adequado de A em determinada situaqao? Nao podemos estimar 
a Equafao (37) diretamente, pois ela envolve nao so os parametros de regressao e f} 2 como tambem A, que 
entra nao linearmente. Mas podemos usar o metodo de maxima verossimilhanqa para estimar todos esses para¬ 
metros. Existem pacotes de regressao apenas para fazer isso. 

Nao abordaremos esse topico aqui, porque o procedimento e um tanto complexo. 

No entanto, podemos recorrer a tentativa e erro. Escolha diversos valores para A, transforme Y de acordo, calcu- 
le a regressao (37) e obtenha o soma dos quadrados dos residuos (SQR) para cada regressao transformada. Escolha 
o valor de A que oferece o menor SQR. 2 


2 Para uma discussao acessivel, consulte NETER, John; KUTNER, Michael; NACHTSHEIM, Cristopher; WASSERMAN, 
William. Applied regression models. 3. ed. Chicago: Richard D. Irving, 1996. 





Capitulo 

Analise de regressao 
multipla: o problema 
da estimagao 

O modelo de duas variaveis estudado extensamente nos capitulos anteriores muitas vezes e inade- 
quado na pratica. No exemplo de consumo e renda (Exemplo 3.1), assumiu-se implicitamente que 
apenas a renda X afeta o consumo Y. No entanto, raramente a teoria economica e tao simples; alem da 
renda, ha diversas outras variaveis que possivelmente afetam as despesas de consumo. Um exemplo 
obvio e a riqueza do consumidor. Outro, a demanda por um bem depende nao so de seu prego, mas 
tambem do prego de outros bens substitutes ou complementares, da renda do consumidor, do status 
social etc. Portanto, precisamos ampliar nosso modelo de regressao simples com duas variaveis para 
abranger casos que envolvem mais de duas variaveis. Adicionar mais variaveis leva-nos a discussao 
dos modelos de regressao multipla em que a variavel dependente, ou regressando, Y, depende de duas 
ou mais variaveis explanatorias, ou regressores. 

O modelo de regressao multipla mais simples posslvel e o de tres variaveis, uma dependente e 
duas explanatorias. Neste e no proximo capitulo, estudaremos esse modelo. De modo geral, estamos 
interessados em modelos de regressao linear multipla, isto e, modelos lineares nos parametros, po- 
dendo ou nao ser lineares nas variaveis. 



7.1 O modelo de tres variaveis: notagao e hipoteses 

Generalizando a fungao de regressao populacional com duas variaveis (FRP), Equagao (2.4.2), 
podemos escrever a FRP com tres variaveis do seguinte modo: 

Yi = Pi + P2X21 + PiXn + Uj ^ 

em que Yea variavel dependente, X 2 e X 3 , as variaveis explanatorias (ou regressores), u o termo de erro 
estocastico e z, o indicador da z-esima observagao: no caso em que os dados sao series temporais, o subs- 
crito t denota a observagao de ordem t . 1 

Na Equagao (7.1.1), /i, e o intercepto. Como de costume, ele da o efeito medio sobre Y de todas as 
variaveis excluidas do modelo, embora sua interpretagao mecanica seja do valor medio de Y quando X 2 
e A 3 sao iguais a zero. Os coeficientes P 2 e /I 3 sao denominados coeflcientes parciais de regressao e seus 
significados serao explicados em breve. 


1 Para fins de simetria da notagao, a Equagao (7.1.1) tambem pode ser escrita como: 

Yi = ySi Xy + P 2 X 21 + PlXy + Uj 

desde que Xy = 1 para todos os /. 
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Continuaremos operando dentro da estrutura do modelo classico de regressao linear (MCRL) 
apresentado no Capitulo 3. Especificamente, estamos considerando o seguinte: 


HIPOTESES 

1. Modelo de regressao linear, ou linear nos parametros. 

2. Valores fixos de X ou valores de X independentes do termo de erro. Aqui, 

isso significa que e necessario covariancia igual a zero entre u ,• e cada variavel X. 

(7.1.2) 


cov (; Ui,X 2i ) = cov (m,, X 3( ) = 0 

3. O termo de erro u, tem valor medio zero. 

(7.1.3) 2 


E{ui X 2 i ,X 3 ,) = 0 para cada i 

4. Homocedasticidade ou variancia constante de u,. 

(7.1.4) 


var (m, ) = a 2 

5. Ausencia de autocorrelagao, ou de correlagao serial, entre os termos de erro. 

(7.1.5) 


COV (M;, Uj) = 0 i^j 

6. O numero de observagoes n deve ser maior que 0 numero de parametros a serem 

(7.1.6) 


estimados, neste caso, 3. 

(7.1.7) 


7. Deve haver variagao nos valores das variaveis X. 

Trataremos tambem de outros dois requisitos. 

8 . Nao ha colinearidade exata entre as variaveis X. 

(7.1.8) 


Nao ha relagao linear exata entre X 2 e X 3 

Na Segao 7.7 dedicaremos mais tempo discutindo a ultima hipotese. 

9. Ausencia de vies de especificagao. 

(7.1.9) 


O modelo esta corretamente especificado. 

(7.1.10) 


A logica das Hipoteses (7.1.2) a (7.1. 6 ) e a mesma que foi discutida na Segao 3.2. A Hipotese (7.1.9), 
ausencia de relagao linear exata entre X 2 e X 3 , e conhecida tecnicamente como ausencia de colinearidade 
ou ausencia de multicolinearidade, se estiverem envolvidas mais de uma relagao linear exata. 

Informalmente, a ausencia de colinearidade significa que nenhum dos regressores pode ser 
expresso como uma combinagao linear exata dos demais regressores do modelo. 

Formalmente, a ausencia de colinearidade significa que nao existe um conjunto de numeros, 7 2 e 
7 . 3 , que nao sejam os dois iguais a zero, tais que: 

7 . 2 X 2 , + 73 X 3 i — 0 (7.1.11) 

Se essa relagao linear exata existe, diz-se que X 2 e X 3 sao colineares ou linearmente dependentes. Por 
outro lado, se a Equagao (7.1.11) so e verdadeira quando 7 2 = 7 3 = 0, diz-se que X 2 e X 3 sao linear¬ 
mente independentes. 

Assim, se 

X 2i = - 4 X 3 , ou Xu + 4 X 3 , = 0 (7.1.12) 

as duas variaveis sao linearmente dependentes, e, se ambas forem inclufdas em um modelo de re¬ 
gressao, havera colinearidade perfeita ou relagao linear exata entre os dois regressores. 

Embora consideremos o problema da colinearidade a fundo no Capitulo 10, a logica por tras da 
hipotese de ausencia de colinearidade exata nao e diffcil de entender. Suponha que, na Equagao 
(7.1.1), Y, X 2 e X 3 representem despesa de consumo, renda e riqueza do consumidor, respectivamente. 
Ao postular que a despesa de consumo relaciona-se linearmente com a renda e a riqueza, a teoria 


2 Esta hipotese sera atendida automaticamente se X 2 e X 3 forem nao estocasticos e a Equagao (7.1.4) for valida. 
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economica presume que a riqueza e a renda podem ter uma influencia independente sobre o consumo. 
Caso contrario, nao faz sentido incluir as duas variaveis no modelo. No extremo, se houver uma rela- 
gao linear exata entre renda e riqueza, so teremos uma variavel independente, nao duas, e nao havera 
forma de avaliar a influencia separada da renda e da riqueza sobre o consumo. Para melhor entender- 
mos, seja X 3l — 2X 2 , na regressao de consumo-renda-riqueza. A regressao (7.1.1) torna-se 

Yi = P i + P2X2 i + Pfl 2 X 2 i) + u t 
= Pi + ( P 2 + 2 p 3 )X 2i + u ( (7.1.13) 

= P\ + o/X 2 i + Uj 

em que a — (fl 2 + 2/f 3 ). Temos na verdade uma regressao com duas, e nao tres, variaveis. Alem disso, 
se calcularmos a regressao (7.1.13) e obtivermos a, nao havera como estimar a influencia separada de 
X 2 (— P 2 ) eX 2 ( — p 2 ) sobre Y, pois a da a influencia combinada de X 2 e X 3 sobre Y . 3 

Em resumo, a hipotese de ausencia de multicolinearidade perfeita exige que se inclua na fungao 
de regressao populacional apenas aquelas variaveis que nao sejam fungoes lineares exatas de uma ou 
mais variaveis do modelo. Embora este topico seja abordado em maior profundidade no Capftulo 10, 
cabe aqui fazer algumas observagoes. 

Primeiro, a hipotese da ausencia de multicolinearidade e parte de nosso modelo teorico (a FRP). 
Na pratica, quando coletamos dados para analises, nada garante que nao existira correlagao entre 
os regressores. Na verdade, na maior parte do trabalho aplicado, e quase impossfvel encontrar duas 
ou mais variaveis (economicas) que nao tenham alguma corrcla^'ao, como mostraremos mais adian- 
te nos exemplos ilustrativos deste capitulo. O necessario e que nao haja uma relafao linear exata 
entre os regressores, como na Equa§ao (7.1.12). 

Segundo, tenha em mente que estamos falando apenas de relagoes lineares perfeitas entre duas ou 
mais variaveis. A multicolinearidade nao exclui redoes nao lineares exatas entre variaveis. Suponha 
que X 3i — X * 2 2j . Isso nao contradiz a hipotese de ausencia de colinearidade perfeita, ja que nesse caso 
a rela 5 ao entre as variaveis e nao linear. 


7.2 Interpreta^ao da equa^ao de regressao multipla 

Dadas as hipoteses do modelo classico de regressao, segue-se que, ao tomar a esperanga condicio- 
nal de Y nos dois lados da Equa 5 ao (7.1.1), obtemos 

E(Yi | X 2i , X 2i ) = Pi + P 2 X 2i + PiiXn (7.2.1) 

Em palavras, a Equagao (7.2.1) fomece o valor esperado ou a media de Y condicional aos valores 
dados ou fixados de X 2 e X 2 . Assim como no caso de duas variaveis, a analise de regressao multipla esta 
condicionada aos valores fixados dos regressores e o que obtemos e o valor medio de Y ou a resposta 
media de Y para os valores dos regressores. 


7.3 O significado dos coeficientes parciais de regressao 

Como ja mencionado, os coeficientes de regressao P> 2 e p 2 sao conhecidos como coeficientes parciais 
de regressao ou coeficientes parciais angulares. Seu significado e o seguinte: P 2 mede a variacao 

no valor medio de Y, E(Y), por unidade de variagao em X 2 , mantendo-se o valor de A 3 constante. 
Em outras palavras, ele nos da o efeito “direto” ou “liquido” de uma unidade de variagao em X 2 sobre 
o valor medio de Y, exclufdos os efeitos que A 3 possa ter sobre a media de Y. De modo analogo, /J 3 


3 Em termos matematicos, a = (fS 2 + 2fi 3 ) e uma equagao com duas incognitas e nao ha uma forma unica de 
estimar fi 2 e fi 3 com base no a estimado. 
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mede a variable do valor medio de Y por unidade de variagao em X 2 , mantendo-se constante o valor 
de X 2 . 4 Ele nos da o efeito “direto” ou “liquido” de uma unidade de variagao de X 3 sobre o valor me¬ 
dio de Y, excluldos quaisquer efeitos que X 2 possa ter sobre o valor medio de F. 5 

Como mantemos, constante na realidade a, influencia de um regressor? Para explicar isso, volte- 
mos ao exemplo da mortalidade infantil (Exemplo 6.6). Lembre-se de que nesse exemplo, Y = morta- 
lidade infantil (MI), X 2 — PNB per capita (PNB/jc) e X 3 — taxa de alfabetizagao feminina (TAF). Suponha 
que queiramos manter constante a influencia de TAF. Como TAF pode ter algum efeito sobre a MI, 
assim como o PNB/jc em qualquer caso concreto, o que podemos fazer e remover a influencia (linear) 
da TAF da MI e do PNB/jc calculando a regressao de MI contra a TAF e a do PNB/jc contra a TAF 
separadamente e examinando os resfduos obtidos nessas regressoes. Usando os dados da Tabela 6.4, 
obtemos as seguintes regressoes: 

MI, = 263,8635 - 2,3905 TAF, + u u 
ep = (12,2249) (0,2133) r 2 = 0,6695 (7.3.1) 


em que u u representa o termo residual da regressao. 

PNB/jc, = -39,3033 + 28,1427 TAF, + u 2i 

ep= (734,9526) (12,8211) r 2 = 0,0721 (7.3.2) 

em que u 2j representa o termo residual dessa regressao. 

Agora 


u u = (MI, - 263,8635 + 2,3905 TAF,) (7.3.3) 

representa a parte da MI que resta apos removermos da expressao a influencia (linear) de TAF. Do 
mesmo modo. 


u 2i = (PNB/jc, + 39,3033 - 28,1427 TAF,) (7.3.4) 

representa a parte do PNB/jc que sobra apos remover a influencia (linear) de TAF. 

Portanto, se agora fizermos uma regressao de u \, contra u 2h que foram “purificados” da influencia 
linear de TAF, nao obteremos o efeito liquido do PNB/jc sobre a MI? E e justamente isso o que ocorre 
(veja a Segao 7A.2 do Apendice 7A). Os resultados da regressao sao os seguintes: 

U\i = — 0,0056W21 (y ^ ^ 

ep = (0,0019) r 2 = 0,1152 

Nota: essa regressao nao tem termo de intercepto, porque o valor medio dos residuos de MQO, u \, e 
u 2i , e igual a zero. (Por que?) 

O coeficiente angular de —0,0056 da, agora, o efeito “verdadeiro” ou liquido de uma variat/ao 
unitaria do PNBpc sobre a MI ou a inclinac/ao verdadeira da MI em relac/ao ao PNB/jc. Ou seja, propor- 
ciona o coeficiente parcial de regressao da MI com relac/ao ao PNB/jc, (i 2 . 

Os leitores que quiserem obter o coeficiente parcial de regressao da MI em relac/ao a TAF podem 
replicar o procedimento anterior, calculando primeiro a regressao da MI contra o PNBpc e obtendo 


4 0 leitor afeito ao calculo observara logo que f} 2 e /b sao derivadas parciais de £(V'|X 2 , X 3 ) em relaqao a X 2 e X 3 . 

5 Note que as expressoes mantendo constante, controlando, levando em conta a influencia de, corrigindo a influencia 
de e excluindo a influencia de sao sinonimos e serao usados de modo intercambiavel neste livro. 
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os resfduos dessa regressao (w 1; ), depois calculando a regressao da TAF contra o PNBpc e obtendo 
os resfduos dessa regressao (m 2 ,) e, entao, fazendo a regressao de u u contra u 2i . Tenho certeza de 
que os leitores entenderam a ideia. 

Sera que e preciso repetir todas essas etapas cada vez que desejarmos obter os verdadeiros coeficien- 
tes parciais de regressao? Felizmente, nao e necessario, pois o procedimento de MQO que veremos na 
proxima segao permite fazer a mesma coisa de modo rapido e rotineiro. O procedimento que aca- 
bamos de descrever teve apenas o proposito didatico de propiciar o entendimento do sentido do 
coeficiente “parcial” de regressao. 


7.4 Ibslimarao dos coeficientes parciais de regressao por meio dos 
metodos de minimos quadrados ordinarios e de maxima 
vcrossimilliaiica 

Para estimarmos os parametros do modelo de regressao com tres variaveis (7.1.1), primeiro con- 
sideramos o metodo dos minimos quadrados ordinarios (MQO) apresentado no Capitulo 3 e depois 
consideraremos brevemente o metodo da maxima verossimilhanga (MV) visto no Capitulo 4. 

Estimadores de MQO 

Para encontrarmos os estimadores de MQO, vejamos primeiro a fungao de regressao amostral (FRA) 
correspondente a fungao de regressao populacional (FRP) da Equagao (7.1.1) que e a seguinte: 

Yi = + p 2 X 2l + P 3 X 3 i + Ui (7.4.1) 

em que m, e o termo residual, a contrapartida amostral do termo de erro estocastico u L 

Como observamos no Capitulo 3, o procedimento de MQO consiste na escolha dos valores dos 
parametros desconhecidos de forma que a soma dos quadrados dos resfduos (SQR) 12 seja a menor 
possfvel. Simbolicamente, 

min u] =YjJi-h~ hX 2i ~ hX 3 if (7.4.2) 

em que a expressao da SQR e obtida por simples manipulagao algebrica da Equagao (7.4.1). 

O procedimento mais objetivo para obter estimadores que minimizem a Equagao (7.4.2) e derivar 
em relagao a incognita (betas), igualar a zero as expressoes resultantes e resolve-las simultaneamente. 
Como mostra a Segao 7A.1 do Apendice 7A, esse procedimento da as seguintes equagdes normais (veja 


as Equagoes (3.1.4) e (3.1.5)): 

Y = 0! + faX 2 + P 3 X 3 (7 - 43) 

J2 Y i x 2i - x h + h Y. x » x * (7 - 4 - 4) 

y, YiXn = [i\ ^ X 2i + ji 2 X 2 i X 3i + $3 22 X\i (7.4.5) 

Com base na Equagao (7.4.3), verificamos de imediato que 

Pi = Y - p 2 X 2 - P 3 X 3 (7.4.6) 

que e o estimador de MQO do intercepto populacional Pi. 


Seguindo a convengao de denotar por minusculas os desvios dos valores medios amostrais, pode- 
mos deduzir as seguintes formulas com base nas equagoes normais (7.4.3) a (7.4.5): 
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ft = (E-ft*2,-)(E4) ~ (E.P3,)(E^2^3,) 6 

(E4)(E4)-(E™,) 2 

a = (E^3.)(E4) ~ (E^^-)(E^^») (74g) 

3 “ (E4)(E4)-(EW 

que nos dao os estimadores de MQO dos coeficientes parciais de regressao populacional ft 2 e / 6 3 , 
respectivamente. 

Note o seguinte: (1) as Equacoes (7.4.7) e (7.4.8) sao de natureza simetrica, porque uma pode ser 
obtida por meio da outra pela troca dos papeis de X 2 e X 3 ; (2) os denominadores dessas duas equa£oes 
sao identicos; e (3) o caso de tres variaveis e uma extensao natural do caso de duas variaveis. 


Variancias e erros padrao dos estimadores de MQO 

Apos obtermos os estimadores de MQO dos coeficientes parciais de regressao, podemos deduzir 
as variancias e os erros-padrao desses estimadores da maneira indicada no Apendice 3A.3. Como 
no caso de duas variaveis, precisamos dos erros-padrao para dois propositos principals: estabelecer 
intervalos de confian£a e testar hipoteses estatisticas. As formulas relevantes sao as seguintes : 6 7 8 


var(^i) = 


]_ + 4 E4 + 4 E4 ~ 2X l X i H x 2i x V 
E4E4-(E^,) 2 


ep(/Si) = + Vvar^O 

var(/S 2 ) 


E4 


(E4HE4)- (E™,) 


(7.4.9) 

(7.4.10) 

(7.4.11) 


ou, de modo equivalente. 


var(yd 2 ) = 



(7.4.12) 


em que r 2 3 e o coeficiente de correlate) amostral entre X 2 e X 3 como definido no Capitulo 3. 

ep(y 6 2 ) = + V^arG 62 ) (7.4.13) 


var(/i 3 ) = --- j( 

(E4)(E4) - (EW 


(7.4.14) 


ou, de modo equivalente. 


var(/i 3 ) 


E40 - 4) 


(7.4.15) 


6 Este estimador e igual ao da Equagao (7.3.5), como mostra a Segao 7A.2 do Apendice 7A. 

7 As dedugoes destas formulas sao mais faceis quando se usa notagao matricial. Os leitores avan^ados podem con- 
sultar o Apendice C. 

8 Usando a definigao de rdada no Capitulo 3, temos: 


2 = (E^2/x 3i ) 2 

23 " £4£4 
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ep(Ai) 


var(/j 3 ) 


(7.4.16) 


cov(/S 2 , As) 


_ -rgcr 1 _ 

(i-^)yE4^4 


(7.4.17) 


Em todas essas formulas, o 2 e a variancia (homocedastica) dos termos de erro da popula?ao, n,-. 

Segundo o argumento da Seqao 3A.5 do Apendice 3A, o leitor pode verificar que um estimador 
nao viesado de o 2 e dado por: 


a 


2 



(7.4.18) 


Observe a semelhanqa entre esse estimador de o 2 e sua contrapartida de duas variaveis 
[a 2 = (£u 2 )/(n _ 2)]. Os graus de liberdade agora sao (n — 3), porque, ao calcularmos J]m 2 , 
precisamos estimar primeiro /J h (i 2 e /3 3 , o que consome 3 graus de liberdade. (O argumento e bem 
geral. No caso de quatro variaveis, os graus de liberdade serao iguais an — 4.) 

O estimador de a 2 pode ser calculado com base na Equa 5 ao (7.4.18) quando os resfduos estao 
disponfveis, mas tambem pode ser obtido mais prontamente usando a seguinte rela 5 ao (para a demons- 
tra 9 ao, veja a Segao 7A.3 do Apendice 7A): 

u 2 i = Y y i ~ P 1 Y yiX2i ~ P 2 Y y ‘ X3 ‘ (7.4.19) 

que e a contrapartida de tres variaveis a rela 9 ao dada na Equa 9 ao (3.3.6). 

Propriedades dos estimadores de MQO 

As propriedades dos estimadores de minimos quadrados ordinarios (MQO) no modelo de regressao 
multipla sao semelhantes as do modelo de duas variaveis. Especificamente: 

1. A linha (superffcie) de regressao de tres variaveis passa pelas medias Y, X 2 e X 2 o que fica evidente 
por meio da Equa 9 ao (7.4.3) (veja a Equa 9 ao (3.1.7) do modelo com duas variaveis). Essa proprie- 
dade e valida de modo geral. No modelo de regressao linear com k variaveis (um regressando e 
(k — 1) regressores) 

Yi = Pi + fcXii + faX-u + •■■ + PkXkj + w, (7.4.20) 

temos 

P\= Y - P 2 X 2 -foXi - f) k X k (7.4.21) 

2. O valor medio estimado de Y i (— F ; ) e igual a media do Y t efetivo, o que e facil de demonstrar: 

Y, = A + kXn + faX 3i 

= (Y - hXi - foXi) + p 2 X 2l + $3X2, (Por que?) 

= Y + h(X 2l - X 2 ) + fo(X 3 i - X 3 ) (7.4.22) 

- Y + p 2 x 2 i + 

em que, como sempre, as letras minusculas indicam os valores das variaveis em termos de desvios 
das respectivas medias. 
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Somando os valores amostrais de ambos os lados da Equayao (7.4.22) e dividindo pelo tamanho 
da amostra n, obtemos Y — Y. (Nota x 2 / = E x a = 0. Por que?) Observe que, devido a Equa- 
5 ao (7.4.22), podemos escrever: 

yt = P 2 X 2 i + P 3 X 31 (7.4.2B) 


em que y, = (Y t - Y ). 

Portanto, a fun 9 ao de regressao amostral pode ser expressa na forma de desvios como 

Vi = Vi + Ui = p 2 X2i + $ 3 X 31 + ili (7.4.24) 

3. E = u = 0, que pode ser verificada com base na Equapao (7.4.24). ( Dica : some os dois lados 
da Equa 5 ao (7.4.24) para todos os valores da amostra.) 

4. Os reslduos m, nao estao correlacionados com X 2i e X 3i , isto e, u ,X 2 , = « 1 X3, = 0 (veja a 

demonstra§ao no Apendice 7.A.1). 

5. Os reslduos iJ, nao estao correlacionados com Y h isto e, ^ F, = 0. (Por que?) {Dica: multiplique 
os dois lados da Equa 9 ao (7.4.23) por «, e some para todos os valores amostrais.) 

6 . Das Equa 9 oes (7.4.12) e (7.4.15), fica evidente que, quando r 2 3 , o coeficiente de correlapao 
entre X 2 e X 2 , aumenta aproximando-se de 1, as variancias de f J > 2 e $3 aumentam para valores 
dados de cr e ^ x\ t ou xj r No limite, quando r 2 3 = 1 (ou seja, a colinearidade for perfeita), 
essas variancias tornam-se infinitas. As implicapoes disso serao exploradas a fundo no Capitulo 
10 , mas o leitor pode perceber que, a medida que r 2 3 aumenta, fica cada vez mais dificil saber 
quais sao os valores verdadeiros de ft 2 e /i 3 . (Falaremos mais no proximo capitulo, mas veja a 
Equa 9 ao (7.1.13).) 

7. Tambem fica claro, por meio das Equa 9 oes (7.4.12) e (7.4.15), que, para valores dados de r 2 3 e 
E4 «uE 4 , as variancias dos estimadores de MQO sao diretamente proporcionais a cr 2 ; ou 
seja, eles aumentam a medida que cr 2 aumenta. Do mesmo modo, para valores dados de cr e r 2 3 , a 
variancia de ft 2 e inversamente proporcional a E x 2 h isto e, quanto maior a variancia dos valores 
amostrais de X 2 , menor a variancia de fl 2 e, portanto, de f> 2 . Pode-se dizer o mesmo da variancia 
de /f 3 . 

8 . Dadas as hipoteses do modelo classico de regressao linear, especificadas na Se 9 ao 7.1, pode-se 
demonstrar que os estimadores de MQO dos coeficientes parciais de regressao nao sao apenas 
lineares e nao viesados, mas tambem tem a variancia minima dentro da classe de todos os estima¬ 
dores lineares nao viesados (ou nao tendenciosos). Em resumo, sao MELNT ou BLUE. Dito de 
forma diferente, eles atendem ao teorema de Gauss-Markov. (A demonstra 9 ao e semelhante aque- 
la do caso das duas variaveis da Se 9 ao 3A.6 do Apendice 3 A e sera apresentada de modo mais resu- 
mido no Apendice C usando nota 9 ao matricial.) 

Estimadores de maxima verossimilhan^a 

Mencionamos no Capitulo 4 que, sob a hipotese de que «„ o termo de erro da popula 9 ao, segue a 
distribui 9 ao normal com media zero e variancia constante cr 2 , os estimadores de maxima verossimi- 
lhan 9 a (MV) e os de minimos quadrados ordinarios (MQO) dos coeficientes de regressao do modelo 
de duas variaveis sao identicos. Essa igualdade estende-se aos modelos com qualquer numero de 
variaveis. (Na Se 9 ao 7A.4 do Apendice 7A e apresentada a demonstra 9 ao.) Contudo, isso nao e ver- 
dade no caso do estimador de cr 2 . E possivel demonstrar que o estimador de MV de a 1 6 uj/ n 
independentemente do numero de variaveis do modelo, enquanto o estimador de MQO para cr 2 e 
J^m 2 /(« - 2 ) no caso de duas variaveis, E 4 /( w - 3) no caso de tres variaveis e E uj/(n - k) 
no caso do modelo com k variaveis (7.4.20). Em resumo, o estimador de MQO para cr 2 leva em 
conta o numero de graus de liberdade, enquanto o estimador de maxima verossimilhan 9 a nao. E 
claro, se n for muito grande, os estimadores de MV e de MQO para cr 2 tenderao a aproximar-se. 
(Por que?) 
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7.5 


O coeficiente de determina^ao multiplo, I? 2 , 
e o coeficiente de correla^ao multiplo, R 


No caso de duas variaveis, vimos que r 2 , tal como definido na Equagao (3.5.5), mede a qualidade do 
ajustamento da equagao de regressao, isto e, fomece a proporgao ou percentual da variagao total da 
variavel dependente Y que e explicada pela variavel explanatoria (unica) X. Essa notagao de r pode 
ser facilmente estendida aos modelos com mais de duas variaveis. No caso de modelos com tres va¬ 
riaveis, queremos conhecer a proporgao da variagao de Y que e explicada, conjuntamente, pelas varia¬ 
veis X 2 e Xy A medida que nos oferece essa informagao e o coeficiente de determinagao multiplo, 
denotado por R 2 \ conceitualmente, e semelhante ao r. 

Para deduzirmos R 2 , podemos seguir o procedimento adotado no caso de r 2 e apresentado na Se- 
gao 3.5. Lembre-se de que: 


Y, - P\ + P 2 X 21 + PlXy + Uj 

= Yt + Uj 


(7.5.1) 


em que Y ,• e o valor estimado de Y, dado pela linha de regressao ajustada e e um estimador da verda- 
deira E(Yj I X 2l , X 2i ). Passando a usar as letras minusculas para indicar os desvios em re lagan a media, 
a Equagao (7.5.1) pode ser escrita como: 


Yi - P 2 * 2 i + PiXli + Uj 

= fr + Uj 

Elevando ao quadrado os dois lados dessa expressao e somando os valores amostrais, obtemos 

Y Yi = yf + E + 2 £ *«■“«• 

= £# + (Por que?) 


(7.5.2) 


(7.5.3) 


Em palavras, a Equagao (7.5.3) nos informa que a soma total dos quadrados (STQ) e igual a soma 
dos quadrados explicados pela regressao (SQE) mais a soma dos quadrados dos resfduos (SQR). 
Substituindo por Y sua expressao na Equagao (7.4.19), obtemos 

Y y ‘ = + J2 y ‘ ~ & J2 yiX2i ~ h J2 y ‘ Xi ‘ 

que reorganizada fica 

SQE = y> 2 = p 2 y,y lX2l + Pi Y,y lX i, (7.5.4) 


Por definigao, 


R 2 = 


SQE 

STQ 

P2Yyi x 2i + ft J2yi x 3i 

Yvf 


(7.5.5) 9 


(compare a Equagao (7.5.5) com a Equagao (3.5.6)). 

Como os numeros que entram na Equagao (7.5.5) sao calculados rotineiramente, e facil obter o 
R 2 . Note que R 2 , assim como r 2 , se situa entre 0 e 1. Se for 1, a linha de regressao ajustada explicara 


9 Note que ft 2 tambem pode ser calculado do seguinte modo: 

n2 — 1 SQR_ _ ■, (n-3 )a 2 

STQ Y.yf («-l)5 2 
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100% da variagao de Y Por outro lado, se for 0, o modelo nao explicara nada da variagao de Y. De 
modo geral, R esta entre esses valores extremos. Diz-se que a qualidade do ajustamento e “melhor” 
quanto mais proximo R 2 situar-se de 1. 

Lembre-se de que, no caso de duas variaveis, definimos r como o coeficiente de correlagao e 
dissemos que ele mede o grau de associagao (linear) entre duas variaveis. O coeficiente analogo a 
r para tres ou mais variaveis e o coeficiente de correlagao multipla. denotado por R e que mede o 
grau de associagao entre Y e todas as variaveis explanatorias em conjunto. Embora r possa serpositivo 
ou negativo, R sempre sera positivo. Contudo, na pratica, R tem pouca importancia. O indicador mais 
representative e R 2 . 

Antes de prosseguirmos, vejamos a seguinte relagao entre R 2 e a variancia de um coeficiente par- 
cial de regressao no modelo de regressao multipla com k variaveis dado na Equagao (7.4.20): 


var 03/) 



(7.5.6) 


em que fy e o coeficiente parcial de regressao do regressor Xj e R 2 e o R 1 da regressao de Xj contra os 
restantes (k — 2) regressores. ( Nota: ha [k — 1] regressores no modelo com k variaveis.) Embora a 
utilidade da Equagao (7.5.6) fique evidente no Capitulo 10, sobre multicolinearidade, note que essa 
equagao e apenas uma extensao da formula da Equagao (7.4.12) ou da Equagao (7.4.15) para o 
modelo de regressao com tres variaveis, um regressando e dois regressores. 


7.6 Exemplo ilustrativo 


EXEMPLO 7.1 

Mortalidade 
infantil em 
relagao ao PNB 
per capita e a 
taxa de 
alfabetizagao 
feminina 


No Capitulo 6 , consideramos o comportamento da mortalidade infantil (Ml) em rela^ao 
ao PNB per capita (PNBpc) e verificamos que essa variavel tinha um impacto negativo na 
mortalidade infantil, como seria de esperar. Agora, vejamos a alfabetiza^ao das mulheres, 
medida pela taxa de alfabetizag:ao feminina (TAF). A priori, esperamos que a TAF tambem 
tenha uma influencia negativa sobre a Ml. Quando incluimos as duas variaveis no modelo, 
precisamos isolar a influencia de cada um dos regressores. Precisamos estimar os coeficientes 
(parciais) de regressao de cada regressor. 

Nosso modelo e: 


Ml, = fa + foPNBpc, + /J 3 TAF, + Uj (7.6.1) 

Os dados necessarios sao os da Tabela 6.4. Tenha em mente que a Ml e o numero de obitos 
de crian^as com menos de 5 anos por mil nascidos vivos, PNBpc e o PNB per capita em 1980 
e a TAF e medida em porcentagem. Nossa amostra e constituida de 64 paises. 

Usando o programa estatfstico EViews 6 , obtivemos os seguintes resultados 


Ml, = 263,6416 - 0,0056 PNBpc, - 2,2316TAF, 


ep= (11,5932) (0,0019) (0,2099) R 2 = 0,7077 

R 2 = 0,6981* 

em que os numeros entre parenteses sao os erros padrao estimados. Antes de interpretar 
essa regressao, observe o coeficiente parcial angular do PNBpc, especificamente, —0,0056. 
Nao e exatamente o mesmo que o obtido por meio do processo em tres etapas examinado 
na sefao anterior (veja a Equa^ao (7.3.5))? Mas isso deveria surpreender voce? Nao, mas os 
dois erros padrao sao exatamente iguais, o que tambem nao deveria surpreender. Fizemos 
isso sem aquele trabalhoso procedimento em tres etapas. 


Veja a Sefao 7.8 


( Continua ) 
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EXEMPLO 7.1 

( Continuagao ) 

Agora vamos interpretar os coeficientes da regressao: —0,0056 e o coeficiente parcial de 
regressao do PNBpce diz que, mantida constante a influencia da TAF, quando o PNBpcau- 
menta, por exemplo, em um dolar, a mortalidade infantil reduz-se, em media, de 0,0056 
unidade. Para facilitarmos a interpretagao economica, podemos dizer que se o PNB per capi¬ 
ta aumenta em $1.000, o numero de obitos de criangas com menos de 5 anos cai, em me¬ 
dia, de cerca de 5,6 por mil nascimentos vivos. O coeficiente —2,2316 indica que, mantida 
constante a influencia do PNBpc, o numero de obitos de criangas de menos de 5 anos reduz-se, 
em media, em cerca de 2,23 por mil nascidos vivos quando a taxa de alfabetizagao feminina 
aumenta em um ponto percentual. O valor do intercepto de cerca de 263, interpretado 
mecanicamente, significa que, se os valores do PNBpc e da TAF fossem fixados em zero, a 
mortalidade infantil media seria de cerca de 263 obitos por mil nascidos vivos. Obviamente, 
essa interpretagao deve ser vista com certa reserva. Tudo o que podemos inferir e que, se os dois 
regressores fossem fixados em zero, a mortalidade infantil seria bastante alta, o que faz sentido 
pratico. O valor de R 2 , de aproximadamente 0,71, significa que cerca de 71% da variagao da 
mortalidade infantil pode ser explicada por PNBpc e TAF, um valor bastante alto considerando 
que R 2 pode chegar no maximo a 1. Enfim, os resultados da regressao fazem sentido. 

E quanto a significancia estatfstica dos coeficientes estimados? Trataremos desse assunto 
no Capftulo 8. Como veremos, sob muitos aspectos este capftulo sera uma extensao do Capf¬ 
tulo 5, que tratou o modelo com duas variaveis. Como mostraremos tambem, existem algu- 
mas diferengas importantes na inferencia estatfstica (no teste de hipoteses) entre os modelos 
de duas variaveis e os de regressao multipla. 


Regressao com variaveis padronizadas 

No capftulo anterior, apresentamos o topico sobre regressao com variaveis padronizadas e afirma- 
mos que a analise pode ser estendida a regressoes com muitas variaveis. Lembre-se de que uma variavel 
e considerada padronizada se estiver expressa em termos de desvios em relagao a media e dividida por 
seu desvio padrao. 

No exemplo da mortalidade infantil, os resultados sao os seguintes: 

MI* = - 0,2026 PNB; C - 0,7639TAF* 

(7.6.3) 

ep = (0,0713) (0,0713) R 2 = 0,7077 

Nota: as variaveis com asterisco sao variaveis padronizadas. Observe tambem que nesse modelo nao ha 
intercepto pelas razoes expostas no capftulo anterior. 

Como voce pode ver nessa regressao, com a TAF mantida constante, o aumento de um desvio pa¬ 
drao no PNBpc leva, em media, a uma redugao de 0,2026 desvio padrao na MI. Do mesmo modo, se 
o PNBpc for mantido constante, o aumento de um desvio padrao na TAF levara, em media, a uma re¬ 
dugao de 0,7639 desvio padrao na MI. Em termos relativos, a alfabetizagao feminina tem mais in¬ 
fluencia sobre a mortalidade infantil do que o PNB per capita. Aqui voce pode ver a importancia de usar 
variaveis padronizadas, pois a padronizagao permite dispor todas as variaveis em pe de igualdade, todas 
as variaveis padronizadas tem media zero e variancia unitaria. 

Impacto sobre a variavel dependente da variagao de uma 
unidade em mais de um regressor 

Antes de prosseguir, suponha que voce queira descobrir o que aconteceria com a taxa de mortali¬ 
dade infantil se aumentassemos o PNBpc e a TAF simultaneamente. Suponha que o PNB aumentasse 
em 1 dolar e ao mesmo tempo a alfabetizagao feminina aumentasse em um ponto percentual. Qual seria 
o impacto dessa variagao simultanea sobre a taxa de mortalidade infantil? Para descobrirmos, tudo o que 
precisamos fazer e multiplicar os coeficientes do PNBpc e da TAF pelas variagoes propostas e adicionar 
os termos resultantes. Em nosso exemplo isso da: 


0,0056(1) - 2,2316(1) = 2,2372 
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Como resultado dessa variagao simultanea no PNB/?r; e na TAF, o numero de obitos de criangas com 
menos de 5 anos cairia em cerca de 2,24 mortes. 

De modo mais geral, se quisermos verificar o impacto total sobre a variavel dependente da varia¬ 
gao de uma unidade em mais de um regressor, so precisaremos mnltiplicar os coeficientes desses re- 
gressores pela variagao proposta e somar os produtos. Note que o termo de intercepto nao entra 
nesses calculos. (Por que?) 


7.7 Regressao simples no contexto da regressao multipla: 
uma introdu<jao ao vies de especifica^ao 

Lembre-se de que a Hipotese (7.1.10) do modelo classico de regressao linear afirma que o modelo 
de regressao utilizado na analise esta “corretamente” especificado, nao ha vies de especificagao ou 
erro de especificagao (veja no Capftulo 3 algumas observagdes iniciais). Embora o topico sobre erro de 
especificagao seja visto com mais detalhes no Capitulo 13, o exemplo da segao anterior nos oferece 
otima oportunidade nao apenas de rcforcar a importancia da Hipotese (7.1.10), mas tambem de langar 
mais luz sobre o significado do coeficiente parcial de regressao e proporcionar uma introdugao um 
tanto informal ao topico do vies de especificagao. 

Suponha que a Equagao (7.6.1) seja o modelo que explica “verdadeiramente” o comportamento 
da mortalidade infantil em relagao ao PNB per capita e a taxa de alfabetizagao feminina (TAF). Mas 
suponha que deixemos de lado a TAF e estimemos a seguinte regressao simples: 

Yj = u\ + 012 X 21 + U\i (7.7.1) 


em que Y — MI e X 2 — PNB/?r: 

Como a Equagao (7.6.1) e o verdadeiro modelo, estimar a Equagao (7.7.1) constituiria um erro de 
especificagao, sendo o erro a omissao da variavel X 3 , a taxa de alfabetizagao feminina. Note que esta- 
mos usando slmbolos diferentes para os parametros (os alfas) na EquacTto (7.7.1) para distingui-los 
dos verdadeiros parametros (os betas) dados na Equagao (7.6.1). 

Sera que a 2 oferecera uma estimativa nao viesada da verdadeira influencia do PNBpc, dada por j5 2 
no modelo (7.6.1)? Sera E — (a 2 ) = Pi, em que a 2 e o valor estimado de a 2 ? Em outras palavras, o 
coeficiente do PNBpc na Equagao (7.7.1) fornecera uma estimativa nao viesada da verdadeira in¬ 
fluencia do PNB/zc sobre a MI, sabendo-se que omitimos a variavel X 3 (TAF) do modelo? Como voce 
suspeita, de modo geral, a 2 nao sera um estimador nao viesado do verdadeiro p 2 - P a ra terrnos uma 
ideia do vies, calculamos a regressao (7.7.1). que obteve os seguintes resultados: 

MI, = 157,4244 - 0,0114PNB„ C 

p (7.7.2) 

ep = (9,8455) (0,0032) ^=0,1662 

Observe alguns detalhes na comparagao entre esta regressao e a regressao multipla “verdadeira” 
(7.6.1): 

1. Em termos absolutos (desconsiderando o sinal), o coeficiente do PNBpc aumentou de 0,0056 
para 0,0114, um aumento de quase duas vezes. 

2. Os erros padrao sao diferentes. 

3. Os valores do intercepto sao diferentes. 

4. Os valores de r 1 divergem substancialmente, embora em geral seja normal que, a medida que 
o numero de regressores no modelo aumenta, o valor de r 2 tambem aumente. 
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Agora, suponha que voce calcule a regressao da mortalidade infantil contra a taxa de alfabetizapao 
feminina, desconsiderando a influencia do PNBpc. Os resultados obtidos foram os seguintes: 

MI, = 263,8635 - 2,3905 TAF, 7 

ep= (21,2249) (0,2133) r 2 = 0,6696 

Comparando novamente os resultados desta regressao (mal especificada) com os da regressao 
multipla “verdadeira”, voce vera que os resultados sao diferentes, embora neste caso as diferenpas nao 
sejam tao notaveis quanto no caso da regressao (7.7.2). 

Um aspecto importante a observar e que uma especificaqao equivocada do modelo pode ter graves 
consequencias. Veremos isso mais a fundo no Capitulo 13, sobre erros de especificapao. 


7.8 R 2 e R 2 ajustado 


Uma propriedade importante do R 2 e que ele e uma funpao nao decrescente do numero de varia- 
veis explanatorias ou regressores presentes no modelo, a menos que a variavel adicionada seja per- 
feitamente colinear com os outros regressores. A medida que o numero de regressores aumenta, 
quase invariavelmente R 2 aumenta e nunca diminui. Dito de outra forma, uma variavel X adicional 
nao reduz o valor de R 1 . Compare, por exemplo, a regressao (7.7.2) ou a (7.7.3) com a (7.6.2). Para ver 
isso, lembre-se de que a definipao dos coeficientes de determinapao: 


R 2 = 


SQE 

STQ 


SQR 

STQ 


A 2 


= 1 - 


E“ 

Et , 2 


(7.8.1) 


Agora, EU 2 e independente do numero de variaveis X do modelo porque e apenas E (Ti ~ P) 2 - A 
SQR, E no entanto, depende do numero de regressores do modelo. Intuitivamente, fica claro que 
a medida que a quantidade de variaveis X aumenta, X! 'C tende a diminuir (ou pelo menos nao 
aumenta); assim R 2 , tal como definido na Equapao (7.8.1), aumentara. Em vista disso, ao comparar- 
mos dois modelos de regressao com a mesma variavel dependente, mas com numero diferente de 
variaveis X, poderfamos ser levados a escolher o modelo com o R 2 mais alto. 

Para comparar dois termos R 2 , e preciso levar em conta o numero de variaveis X do modelo. Isso 
pode ser feito se considerarmos um coeficiente de determinapao alternativo, que e o seguinte: 


Xm 2 /(» ~ k ) 

Ev, 2 /(« i) 


(7.8.2) 


em que k = numero de parametros do modelo, incluindo o termo de intercepto. (Na regressao com tres 
variaveis, k— 3. Por que?) O R 2 assim definido e conhecido como o R 2 ajustado, denotado por R 2 . O 
termo ajustado significa ajustado pelos graus de liberdade associados a soma de quadrados que entra 
na Equapao (7.8.1): E tem n — k graus de liberdade envolvendo ^parametros, o que inclui o termo 
de intercepto, e E >f tem n — 1 graus de liberdade. (Por que?) Para o caso de tres variaveis, sabemos 
que E w? tem n — 3 graus de liberdade. 

A Equapao (7.8.2) tambem pode ser escrita como 



(7.8.3) 
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em que <r e a variancia residual, um estimador nao viesado do verdadeiro cr, e S y 2 e a variancia amos- 
tral de 7 

E facil verificar que R 2 e R 2 relacionam-se, porque, substituindo a Equa£ao (7.8.1) na Equa£ao 
(7.8.2), obtemos: 

R 2 = 1- (1- R 2 )"—^ (7.8.4) 

Yl K 

Com base na Equafao (7.8.4) fica imediatamente claro que: (1) para k> \, R 2 < R 2 , o que implica 
que, a medida que o numero de variaveis X aumenta, o R 2 ajustado aumenta menos que o R 2 nao 
ajustado; e (2) R 2 pode ser negativo, embora R 2 seja necessariamente nao negativo. 10 Se em uma apli- 
ca£ao R 1 for negativo, seu valor sera tornado como zero. 

Qual R 2 deveria ser empregado na pratica? Como Theil observa: 

[...] e uma boa pratica usar R 2 em vez de R 2 , porque este tende a oferecer um quadro otimista do 

ajustamento da regressao, principalmente quando o numero de variaveis explanatorias nao e muito pe- 

queno em rela^ao ao numero de observances. 11 

Mas a opiniao de Theil nao e compartilhada amplamente, pois ele nao ofereceu nenhuma justifi- 
cativa teorica geral para a “superioridade” do R 2 . Por exemplo, Goldberger argumenta que o R 2 a 
seguir, que chama de R 2 modificado. funcionara igualmente bem: 12 

R 2 Modificado = (1 - k/n)R 2 (7.8.5) 

Seu conselho e relatar o R 2 , o n e o k e deixar ao leitor decidir como fazer o ajustamento de R 1 levando 
em conta n e k. 

A despeito dessa advertencia, e o R 2 ajustado, tal como dado na Equagao (7.8.4), que e adotado 
pela maior parte dos programas de estatfstica juntamente com o R 2 convencional. O leitor e aconse- 
Ihado a tratar R 2 como mais uma estatfstica sintetica. 

Vale mencionar que, no caso da regressao da mortalidade infantil (7.6.2), seria conveniente ao leitor 
verificar se R 2 e 0,6981, mantendo em mente que, neste exemplo, (n — 1) = 63 e (n — k) — 60. 
Como esperado, o R 2 de 0,6981 e menor que o R 2 de 0,7077. 

Alem do emprego do R 2 e do R 2 ajustado como medidas da qualidade do ajustamento, muitas vezes 
sao usados outros criterios para avaliar a adequagao de um modelo de regressao. Dois deles sao o criterio 
de informacao de Akaike e o criterio de previsao de Amemiya, utilizados para fazer a sele^ao entre 
modelos substitutes. Falaremos desses criterios quando considerarmos em mais detalhes o problema da 
selenao de modelos em capftulo mais a frente (veja o Capftulo 13.) 

Compara^ao de dois valores de R 2 

E fundamental observar que, ao comparar dois modelos com base no coeficiente de determinaqao, 
ajustado ou nao, o tamanho da amostra n e a variavel dependente devem ser os mesmos', as variaveis 
explanatorias podem assumir qualquer forma. No caso dos modelos 

In 7/ = fi\ + PiXii + foXn + Ui (7.8.6) 

7, = a\+ 0 . 2 X 21 + 03 X 3 i + Ui (7.8.7) 


- C\ — IA 

10 Note, contudo, que, se R 2 = 1 , R 2 = R 2 = 1 . Quando fl 2 = 0, R 2 = - - 2 ~, caso em que R 2 pode ser negativo 

se k > 1. ( n — k) 

11 THEIL, Henry. Introduction to econometrics. Englewood Cliffs, N. J.: Prentice Hall, 1978. p. 1 35. 

12 GOLDBERGER, Arthur S. A course in econometrics. Cambridge, Mass: Harvard University Press, 1991. p. 178. Para 
uma opiniao mais crftica do R 2 , veja CAMERON, S. "Why is the R squared adjusted reported?" journal of 
Quantitative Economics, jan. 1993. v. 9, n. I, p. 183-186. O autor argumenta que: "Ele [R 2 ] NAO e um teste esta- 
tfstico e parece nao haver uma justificativa intuitiva clara para seu uso como estatfstica descritiva. Porfim, deveria 
ser claro para nos que nao e uma ferramenta eficaz para prevenir a garimpagem de dados" (p. 186). 
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os R 2 obtidos nao podem ser comparados. A razao e a seguinte: por definigao, R 2 mede a proporgao 
da variagao da variavel dependente explicada pelo(s) regressor(es). Na Equagao (7.8.6), R 2 mede a 
proporgao da variagdo em In Y explicada por X 2 e X 2 , enquanto na Equagao (7.8.7) ele mede a propor¬ 
gao da variagdo em Y, e os dois nao sao a mesma coisa: como visto no Capftulo 6, uma variagao em 
In Y da uma variagao relativa ou proporcional em Y, enquanto uma variagao em Y da uma variagao 
absoluta. Portanto, var 7,/var Y i nao e igual a var(ln F, )/var(ln K,), isto e, os dois coeficientes de 
determinagao nao sao o mesmo. 13 

Como e possfvel comparar os R 2 de dois modelos quando o regressando nao esta expresso do 
mesmo modo? Para responder a isso, consideremos um exemplo numerico. 


EXEMPLO 7.2 

Consumo de cafe 
nos Estados 
Unidos, 
1970-1980 


Considere os dados da Tabela 7.1. Eles dizem respeito ao consumo de xfcaras de cafe por 
dia (Y) e o prego real do cafe no varejo (X), nos Estados Unidos, no perfodo 1970-1980. Apli- 
cando o metodo dos mfnimos quadrados ordinarios aos dados, obtemos os seguintes resulta- 
dos da regressao: 


Y t = 2,6911 - 0,4795X t 

ep= (0,1216) (0,1140) SQR = 0,1491; r 2 = 0,6628 


(7.8.8) 


Esses resultados fazem sentido do ponto de vista economico. A medida que os pregos do 
cafe aumentam, em media, o consumo de cafe diminui cerca de meia xfcara por dia. O 
valor de r 2 , de cerca de 0,66, indica que o prego do cafe explica cerca de 66% da variagao 
do consumo de cafe. O leitor pode verificar facilmente que o coeficiente angular e estatis- 
ticamente significativo. 


TABELA 7.1 

Consumo de cafe 
nos Estados Unidos 
(Y) em relagao ao 
prego medio no 
varejo (X),* 
1970-1980 

Fonte: Os dados relativos 
a Y foram extraidos de 
Summary of National 
Coffee Drinking Study, 
Data Group, Elkins Park, 
Penn., 1981; e os dados 
relativos a X nominal 
(pre 50 s correntes do cafe) 
sao de Nielsen Food 
Index, A. C. Nielsen, 
Nova York, 1981. 
Agrade?o a Scott E. 
Sandberg pela coleta 
dos dados. 


Ano 

Y, 

Xfcaras por pessoa/dia 

X, 

$ por lb ( 

1970 

2,57 

0,77 

1971 

2,50 

0,74 

1972 

2,35 

0,72 

1973 

2,30 

0,73 

1974 

2,IS 

0,76 

1975 

2,20 

0,75 

1976 

2,11 

1,08 

1977 

1,94 

1,81 

1978 

1,97 

1,39 

1979 

2,06 

1,20 

1980 

2,02 

1,17 


*Nota: O pre^o nominal foi dividido pelo IPC de alimentos e bebidas, 1967 = 100. 


( Continua) 


13 Da definigao de ft 2 , sabemos que: 

i n 2 - s QR _ 

STQ UYi-Y ) 2 


para o modelo linear e 


1 - ft 2 


Euf 


£0n Yi - In Y) 2 


para o modelo logarftmico. Como os denominadores do lado direito dessas expressoes sao diferentes, nao 
podemos comparar os dois ft 2 diretamente. 

Como mostra o Exemplo 7.2, para a especificagao linear, a SQR = 0,1491 (a soma dos quadrados dos resfduos 
do consumo de cafe) e, para o modelo log-linear, a SQR = 0,0226 (a soma dos quadrados dos resfduos do 
logaritmo do consumo de cafe). Esses resfduos sao de ordens diferentes de magnitude e, portanto, nao po¬ 
dem ser comparados diretamente. 
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EXEMPLO 7.2 

( Continuagao ) 


Com os mesmos dados, pode-se estimar o seguinte modelo log-log ou de elasticidade 
constante: 

in* = 0,7774 - 0,2530 In X t 
ep= (0,0152) (0,0494) SQR = 0,0226; r 2 = 0,7448 

Como este e um modelo log-log, o coeficiente angular oferece uma estimativa direta do 
coeficiente da elasticidade-prefo. Neste caso, diz que, se o pre<;o do cafe por libra (de peso) 
aumentar em 1%, o consumo diario de cafe caira, em media, cerca de 0,25%. Lembre-se de 
que, no modelo linear (7.8.8), o coeficiente angular so nos mostra a taxa de variagao do con¬ 
sumo de cafe em rela^ao ao preg:o. (Como voce estimara a elasticidade-pre^o no caso do mo¬ 
delo linear?) O valor de r 2 de cerca de 0,74 significa que cerca de 74% da varia^ao do logaritmo 
da demanda por cafe e explicada pela varia^ao no logaritmo do prefo do cafe. 

Como o valor de r 2 no modelo linear, de 0,6628, e menor que o do modelo log-linear, de 
0,7448, voce pode ficar tentado a escolher o segundo modelo em fun^ao desse r 2 mais alto. 
Mas, pelas razoes ja expostas, nao e possfvel proceder desse modo. Se quiser comparar os 
dois valores de r 2 , voce deve fazer o seguinte: 

1. Calcular InV) com base na Equagao (7.8.9) para cada observagao, isto e, obter o valor esti- 
mado, em logaritmo, de cada observagao deste modelo. Tomar o antilogaritmo corres- 
pondente a esses valores e calcular r 2 entre esses valores do antilogaritmo e o Y t efetivo da 
forma indicada pela Equafao (3.5.14). Esse valor de r 2 e comparavel ao valor de r 2 do 
modelo linear (7.8.8). 

2. Como alternativa, supondo que todos os valores de Y sejam positivos, obtenha os logaritmos 
dos valores de Y, In Y. Obter os valores estimados de Y, Y t de acordo com o modelo linear 
(7.8.8), tomar os logaritmos desses valores estimados de Y (isto e. In Y t ) e calcular o r 2 entre 
(In Y t ) e (In Y t ) conforme indicado na Equagao (3.5.14). Esse valor de r 2 e comparavel com 
o valor obtido na Equafao (7.8.9). 

Apresentamos, para este exemplo de consumo de cafe, os dados brutos necessarios para o 
calculo dos r 2 comparaveis com base na Tabela 7.2. Para compararmos o valor do r 2 do mode¬ 
lo linear (7.8.8) com aquele de (7.8.9), primeiro obtemos o log de (Y t ) (dado na coluna (6) da 
Tabela 7.2), entao obtemos os logaritmos dos valores efetivos de Y (dados na coluna (5) da ta¬ 
bela) e por fim calculamos o r 2 entre esses dois conjuntos de valores usando a Equagao (3.5.14). 
O resultado e um r 2 de 0,6779, que agora podemos comparar com o valor de r 2 obtido no 
modelo log-linear, 0,7448. A diferen^a entre os dois valores de r 2 e de cerca de 0,07. 


TABELA 7.2 

Dados brutos para 
compara§ao dos 
dois valores de R 2 


Antilogaritmo de 



Y t 

Y t 

lnr t 

lnT t 

In Y t 

In (Y t ) 

Ano 

(1) 

(2) 

(3) 

(4) 

(5) 

(6) 

1970 

2,57 

2,321887 

0,843555 

2,324616 

0,943906 

0,842380 

1971 

2,50 

2,336272 

0,853611 

2,348111 

0,916291 

0,848557 

1972 

2,35 

2,345863 

0,860544 

2,364447 

0,854415 

0,852653 

1973 

2,30 

2,341068 

0,857054 

2,356209 

0,832909 

0,850607 

1974 

2,25 

2,326682 

0,846863 

2,332318 

0,810930 

0,844443 

1975 

2,20 

2,331477 

0,850214 

2,340149 

0,788457 

0,846502 

1976 

2,11 

2,173233 

0,757943 

2,133882 

0,746688 

0,776216 

1977 

1,94 

1,823176 

0,627279 

1,872508 

0,662688 

0,600580 

1978 

1,97 

2,024579 

0,694089 

2,001884 

0,678034 

0,705362 

1979 

2,06 

2,115689 

0,731282 

2,077742 

0,722706 

0,749381 

1980 

2,02 

2,130075 

0,737688 

2,091096 

0,703098 

0,756157 


Notas: 


Coluna (1): valores efetivos de Y constantes da Tabela 7.1. 

Coluna (2): valores de Y estimados com o modelo linear (7.8.8). 
Coluna (3): logaritmos de Y estimados com o modelo log-log (7.8.9). 
Coluna (4): antilogaritmos dos valores constantes da coluna (3). 
Coluna (5): logaritmos dos valores de Y, constantes da coluna (1). 
Coluna (6): logaritmos dos valores de Y, constantes da coluna (2). 


( Continua ) 
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EXEMPLO 7.2 

( Continuagao) 


Por outro lado, se quisermos comparar o valor do r 2 obtido no modelo log-linear com o do 
modelo linear, precisaremos obter lnV t para cada observa^ao da Equagao (7.8.9) (dada na co- 
luna (3) da tabela), obter os antilogaritmos correspondentes (dados na coluna (4) da tabela) e 
por fim calcular o r 2 entre esses antilogaritmos e os valores efetivos de Y, usando a Formula 
(3.5.14). Isso nos dara um valor de r 2 igual a 0,7187, que e ligeiramente mais alto que aque- 
le obtido no modelo linear (7.8.8), ou seja, 0,6628. 

Qualquer que seja o metodo empregado, parece que o modelo log-linear proporciona um 
melhor ajustamento. 


Distribui^ao de R 2 entre os regressores 

Voltemos ao exemplo da mortalidade infantil. Vimos na Equaqao (7.6.2) que os dois regressores 
PNBpc e TAP explicam 0,7077 ou 70,77% da varia 5 ao da mortalidade infantil. Mas considere agora a 
regressao (7.7.2), em que exclufmos a variavel TAF e como resultado o valor do r caiu para 0,1662. Isso 
quer dizer que a diferenpa de 0,5415 (0,7077 — 0,1662) pode ser atribuida a variavel excluida, TAF? Por 
outro lado, se voce considerar a regressao (7.7.3), em que exclufmos a variavel PNBpc, o valor do 
r 2 caira para 0,6696. Sera que isso indica que a diferenpa de 0,0381 (0,7077 — 0,6696) no valor 
do r 2 deve-se a exclusao da variavel PNBpc? 

A pergunta entao e: podemos distribuir o valor de R 2 , 0,7077, entre os dois regressores, PNBpc e 
TAF, desse modo? Infelizmente, nao podemos fazer isso, pois a alocapao depende da ordem em que os 
regressores entram, como acabamos de ilustrar. Parte do problema esta no fato de que os dois regres¬ 
sores estao correlacionados, sendo o coeficiente de correlaqao de 0,2685 (verifique na Tabela 6.4). 
Na maioria das aplica£6es com varios regressores, a correla 5 ao entre eles e um problema comum. 
Obviamente, o problema sera muito grave se houver perfeita colinearidade entre os regressores. 

A melhor crientagao pratica e que ha pouco sentido em tentar distribuir o valor de R 2 entre os 
regressores que o determinam. 

O "jogo" da maximiza^ao de R 2 

Antes de concluirmos esta segao, cabe uma advertencia. As vezes os pesquisadores entram no jogo 
da maximizagao do R 1 : escolhem o modelo que fomece o maior R 2 . Mas isso pode ser perigoso, pois na 
analise de regressao nosso objetivo nao e obter um R 2 alto per se , mas, em vez disso, obter estimativas 
confiaveis dos verdadeiros coeficientes de regressao para a populagao e fazer inferencias estatisticas a 
respeito deles. Na analise pratica nao e raro obter um R 2 muito elevado e verificar que alguns dos 
coeficientes de regressao sao estatisticamente nao significativos ou apresentam sinais contrarios 
aos esperados. Portanto, o pesquisador deve preocupar-se mais com a relevancia logica ou teorica 
das variaveis explanatorias em relapao a variavel dependente e em sua significancia estatistica. Se 
nesse processo obtivermos um R 2 alto, otimo; por outro lado, se o R 2 for baixo, nao significa que o 
modelo seja necessariamente ruim. 14 

A proposito, Goldberger tem uma visao muito crftica do papel do R 2 . Ele disse: 

Em nosso ponto de vista, R 2 tem um papel muito modesto na analise de regressao, sendo uma medida da 

qualidade do ajustamento de uma regressao linear de mfnimos quadrados amostrais em um conjunto de dados. 


14 Alguns autores preferem relativizar o uso de ft 2 como medida de qualidade do ajustamento, bem como seu uso 
para comparar dois ou mais valores de ft 2 . Veja ACHEN, Christopher H. Interpreting and using regression. Beverty Hills, 
Calif.: Sage Publications, 1982. p. 58-67; e GRANGER, C.; NEWBOLD, F. "ft 2 and the transformation of regression 
variables." Journal of Econometrics, 1976. v. 4, p. 205-210. Casualmente, note que a pratica da escolha de um mo¬ 
delo com base no ft 2 mais elevado, uma especie de garimpagem de dados, introduz o que e conhecido como 
vies do pre-teste, que pode destruir algumas das propriedades dos estimadores de MQO do modelo classico 
de regressao linear. Sobre esse topico, o leitor pode consultar JUDGE, George G.; HILL, Carter R.; GRIFFITHS, 
William E.; LUTKEPOHL, Helmuth; LEE, Tsuong-Chao. Introduction to the theory and practice of econometrics. Nova 
York: John Wiley, 1982. cap. 21. 
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Nada no modelo classico de regressao exige que R 1 seja alto. Logo, um R 2 elevado nao e uma evidencia 
favoravel ao modelo, tampouco um R 2 baixo constitui prova desfavoravel. 

Na verdade, o mais importante do R 2 e que ele nao tern importancia no modelo classico de regres¬ 
sao. O modelo classico de regressao trata de parametros da popula?ao, nao da qualidade do ajustamento 
da amostra. [...] Quando se insiste em uma medida de sucesso de previsao (ou melhor, de fracasso), talvez 
cr seja suficiente: afinal, ele e o quadrado do erro de previsao esperado que resultaria se a popula?ao 
[FRP] fosse usada como previsor. Como altemativa, o erro padrao da previsao elevado ao quadrado [... ] 
para valores relevantes de x [regressores] pode ser bastante informativo. 15 


7.9 A fun^ao de produ^ao Cobb-Douglas: 
mais sobre formas funcionais 


Na Se£ao 6.4, mostramos como, com transforma 5 oes adequadas, podemos converter rela^'oes 
nao lineares em rela£oes lineares para trabalharmos dentro do marco de referenda do modelo 
classico de regressao linear. As varias transforma 5 oes examinadas no contexto do caso de duas varia- 
veis podem ser facilmente estendidas aos modelos de regressao multipla. Nesta se£ao, demonstra- 
mos tais transforma 5 oes partindo do modelo log-linear; outras transforma 5 oes serao encontradas 
nos exercicios e nos exemplos apresentados ao longo do livro. O exemplo especifico a ser discutido 
agora e a famosa fun^ao de producao Cobb-Douglas da teoria da produijao. 

A fun£ao de produgao Cobb-Douglas, em sua forma estocastica, pode ser expressa como: 

Y i = (7.9.1) 

em que Y = producao 

X 2 = insumo trabalho 
X 3 = insumo capital 
u — termo de erro estocastico 
e = logaritmo de base natural 


Com base na Equacjao (7.9.1) fica claro que a rela?ao entre a produfao e os dois insumos nao 
e linear. Contudo, se transformarmos logaritmicamente este modelo, obteremos: 


In Yj = In ft + ft In X 2i + fa In X 3l + m , 
= fa + fa In X 2 i + fa \nX 2 j + Uj 


(7.9.2) 


em que fa — In fa. 

Escrito desse modo, o modelo e linear nos parametros fa, fa e fa e, portanto, e um modelo de re¬ 
gressao linear. Note, porem, que e nao linear nas variaveis Y e X, mas e linear nos logaritmos dessas varia- 
veis. Em resumo, a Equa 5 ao (7.9.2) e um modelo log-log, duplo log ou log linear, a contrapartida do modelo 
log-linear (6.5.3) de duas variaveis, agora em termos de regressao multipla. 

As propriedades da fungao de producao Cobb-Douglas sao bem conhecidas: 


1 . fa e a elasticidade (parcial) do produto em rela 5 ao ao insumo trabalho; mede a varia§ao percentual 
da producao quando se verifica, por exemplo, uma variac^ao de 1 % no insumo trabalho, enquanto 
o capital e mantido constante (veja o Exercfcio 7.9). 

2. Do mesmo modo, fa e a elasticidade (parcial) do produto em rclayao ao insumo capital, mantido 
constante o trabalho. 

3. A soma {fa + fa) informa a respeito dos retomos de escala\ a resposta do produto a uma varia 5 ao 
proporcional nos insumos. Se essa soma for igual a 1, havera retomos constantes de escala, isto e, se 
dobrarmos os insumos, a produ§ao dobrara, se os triplicarmos, a produ§ao triplicara e assim por 


15 


GOLDBERGER, Arthur S. Op. cit. p. 177-1 78. 
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diante. Se a soma for menor que 1, havera retomos decrescentes de escala — se dobramos os insu- 
mos, a produpao aumenta menos que o dobro. Por fim, se a soma for maior que 1, havera retomos 
crescentes de escala — quando dobramos os insumos, a produpao crescera mais de duas vezes. 

Antes de prosseguir, note que sempre que temos um modelo de regressao log-linear envolvendo 
qualquer niimero de variaveis, o coeficiente de cada variavel X mede a elasticidade (parcial) da varia- 
vel dependente Y em rela£ao aquela variavel. Em um modelo log-linear com k variaveis: 

In Yi = Po + fa In X 21 + P 2 InXz , + • • ■ + p k In Xu + m, (7.9.3) 


cada um dos coeficientes (parciais) de regressao, de p 2 a P k , e a elasticidade (parcial) de Y em rela£ao as 
variaveis de X 2 aX k . 16 


EXEMPLO 7.3 

Valor agregado, 
horns de 
trabalho e 
insumo capital 
no setor de 
transformagdo 


Para ilustrar a fun^ao de produ^ao Cobb-Douglas, apresentamos os dados da Tabela 7.3, 
que se referem ao setor de transforma<;ao para todos os 50 Estados e a capital, Washington, 
DC, dos Estados Unidos em 2005. 

Supondo que o Modelo (7.9.2) atenda as hipoteses do modelo classico de regressao li¬ 
near, 17 obtivemos a seguinte regressao pelo metodo dos MQO (veja na Segao 7A.5 do 
Apendice 7A a tela do computador com o resultado): 


TABELA 7.3 

Valor agregado, 
horas de trabalho e 
insumo capital no 
setor de 
transforma§ao 


Area 

Alabama 

Alasca 

Arizona 

Arkansas 

California 

Colorado 

Connecticut 

Delaware 

Distrito de Columbia 

Florida 

Georgia 

Haval 

Idaho 

Illinois 

Indiana 

Iowa 

Kansas 

Kentucky 

Louisiana 

Maine 


Produto 
Valor agregado 
(em milhares de $) 
Y 

38.372.840 

1.805.427 

23.736.129 

26.981.983 

217.546.032 

19.462.751 

28.972.772 

14.313.157 

159.921 

47.289.846 

63.015.125 

1.809.052 

10.511.786 

105.324.866 

90.120.459 

39.079.550 

22.826.760 

38.686.340 

69.910.555 

7.856.947 


Insumo trabalho 
Horas trabalhadas 
(em milhares) 
X2 

424.471 

19.895 

206.893 

304.055 

1.809.756 

180.366 

224.267 

54.455 

2.029 

471.211 

659.379 

17.528 

75.414 

963.156 

835.083 

336.159 

246.144 

384.484 

216.149 

82.021 


Insumo capital 
Despesa de 
capital 

(em milhares de $) 
X3 

2.689.076 
57.997 
2.308.272 
1.376.235 
13.554.116 
1.790.751 
1.210.229 
421.064 
7.188 
2.761.281 
3.540.475 
146.371 
848.220 
5.870.409 
5.832.503 
1.795.976 
1.595.118 
2.503.693 
4.726.625 
415.131 


( Continua ) 


16 Para melhor entender, derive parcialmente (7.9.3) com relagao ao log de cada variavel X. Assim, 3ln Y/d In X 2 = 
(dY/X 2 )(X 2 IY) = fi 2 , que e, por definifao, a elasticidade de Y em relagao a X 2 e 3 In V73 In X 3 = (9V/ X 3 )(X 3 /V) = fi 3 , 
que e a elasticidade de Y em relagao a X 3 e assim por diante. 

17 Observe que, na fungao de produgao Cobb-Douglas (7.9.1), inclulmos o termo de erro estocastico de forma 
especial para que a transformagao logarltmica resultante entre na forma linear habitual. A esse respeito, veja a 
Segao 6.9. 
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EXEMPLO 7.3 

(' Continuagao ) 

TABELA 7.3 

( Continuagao ) 


Maryland 

21.352.966 

174.855 

1.729.116 

Massachusetts 

46.044.292 

355.701 

2.706.065 

Michigan 

92.335.528 

943.298 

5.294.356 

Minnesota 

48.304.274 

456.553 

2.833.525 

Mississippi 

17.207.903 

267.806 

1.212.281 

Missouri 

47.340.157 

439.427 

2.404.122 

Montana 

2.644.567 

24.167 

334.008 

Nebraska 

14.650.080 

163.637 

627.806 

Nevada 

7.290.360 

59.737 

522.335 

Nova Hampshire 

9.188.322 

96.106 

507.488 

Nova Jersey 

51.298.516 

407.076 

3.295.056 

Novo Mexico 

20.401.410 

43.079 

404.749 

Nova York 

87.756.129 

727.177 

4.260.353 

Carolina do Norte 

101.268.432 

820.013 

4.086.558 

Dakota do Norte 

3.556.025 

34.723 

184.700 

Ohio 

124.986.166 

1.174.540 

6.301.421 

Oklahoma 

20.451.196 

201.284 

1.327.353 

Oregon 

34.808.109 

257.820 

1.456.683 

Pensilvania 

104.858.322 

944.998 

5.896.392 

Rhode Island 

6.541.356 

68.987 

297.618 

Carolina do Sul 

37.668.126 

400.317 

2.500.071 

Dakota do Sul 

4.988.905 

56.524 

.311.251 

Tennessee 

62.828.100 

582.241 

4.126.465 

Texas 

172.960.157 

1.120.382 

11.588.283 

Utah 

15.702.637 

150.030 

762.671 

Vermont 

5.418.786 

48.134 

276.293 

Virginia 

49.166.991 

425.346 

2.731.669 

Washington 

46.164.427 

313.279 

1.945.860 

Oeste de Virginia 

9.185.967 

89.639 

685.587 

Wisconsin 

66.964.978 

694.628 

3.902.823 

Wyoming 

2.979.475 

15.221 

361.536 


Fonte: 2005 Annual Survey of Manufacturers, Setor 31: Supplemental Statistics for U.S. 


In Yi = 3,8876 + 

0,4683lnX 2l 

+ 0,521 3lnX 3 , 


(0,3962) 

(0,0989) 

(0,0969) 


t= (9,8115) 

(4,7342) 

(5,3803) 

(7.9.4) 


R 2 = 0,9642 gl = 48 
R 2 = 0,9627 


Com base na Equagao (7.9.4) vemos que, no setor de transformafao dos Estados Unidos 
em 2005, as elasticidades da produgao em relagao ao trabalho e ao capital foram de 0,4683 
e 0,521 3, respectivamente. Em outras palavras, nos 50 Estados americanos e no Distrito de 
Columbia, mantido constante o capital, um aumento de 1% no insumo trabalho levou, em 
media, a um aumento de cerca de 0,47% na produg:ao. Da mesma forma, mantidas cons- 
tantes as horas trabalhadas, um aumento de 1% no insumo capital levou, em media, a um 
aumento de 0,52% na produ^ao. Somando as duas elasticidades, obtemos 0,99, que e o 
valor do parametro dos retornos de escala. Como fica evidente, durante o perfodo estudado, 
o setor de transformagao para os 50 Estados americanos e o Distrito de Columbia caracteriza- 
va-se pelos retornos constantes de escala. 

Sob um ponto de vista puramente estatfstico, a linha de regressao estimada ajusta-se mui- 
to bem aos dados. O valor de R 2 , 0,9642, significa que cerca de 96% da varia^ao do logarit- 
mo da produgao e explicada por logaritmos do trabalho e do capital. No Capitulo 8, veremos 
como podemos usar os erros padrao estimados para testar hipoteses sobre os "verdadeiros" 
valores dos parametros da fungao de produfao Cobb-Douglas aplicada ao setor de transfor- 
ma^ao dos Estados Unidos. 
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7.10 Modelos de regressao polinomial 

Agora consideraremos uma classe de modelos de regressao multipla, os modelos polinomiais, que 
tem sido muito usados nas pesquisas econometricas relativas a funpoes de custo e de produpao. Ao 
apresentarmos estes modelos, ampliamos a gama de especificapoes as quais o modelo classico de re¬ 
gressao linear pode ser facilmente aplicado. 

Para fixar a ideia, considere a Figura 7.1, que relaciona o custo marginal (CM) de produpao de 
curto prazo ( Y) de um bem com o nrvel de sua produpao (A). A curva de CM trapada a olho na figura 
e a curva em U dos manuais e mostra que a relapao entre o CM e a produpao nao e linear. Se fossemos 
quantificar essa relapao com base nos pontos de dispersao, como farlamos? Em outras palavras, que 
tipo de modelo econometrico captaria a natureza, primeiro decrescente e depois crescente, dos custos 
marginais? 

Sob o aspecto geometrico, a curva de CM da Figura 7.1 representa uma parabola. Matematica- 
mente, a parabola e representada pela seguinte equapao: 

Y=P 0 +p x X+p 2 X 2 (7.10.1) 

que e conhecida como funcdo quadrdtica ou, de modo mais geral, polindmio de segundo gran na 
variavel A — o expoente mais alto de X representa o grau do polinomio (se acrescentassemos X 3 a 
funpao anterior, teriamos um polinomio de terceiro grau e assim por diante). 

A versao estocastica de (7.10.1) pode ser representada como 

Yi= P o + P\Xi + p 2 Xf + u t (7.10.2) 

e e denominada regressao polinomial de segundo grau. 

A forma geral da regressao polinomial de k-esimo grau pode ser escrita como 

Yj = p 0 + p x Xi + p 2 Xj + ■ ■ • + p k X) + u, (7.10.3) 

Observe que nesses tipos de regressao polinomial so ha uma variavel explanatoria do lado direito, mas 
ela aparece elevada a varias potencias, o que a toma um modelo de regressao multipla. Casualmente, 
note que, se considerarmos que X, seja fixo ou nao estocastico, os termos de A, elevados a uma poten- 
cia tambem se tornam fixos ou nao estocasticos. 

Sera que esses modelos apresentam algum problema especial de estimapao? Como o polinomio de 
segundo grau (7.10.2) ou de Cesimo grau (7.10.3) e linear nos parametros, os p podem ser estimados 
pelo metodo de mmirnos quadrados ordinarios ou da maxima verossimilhanpa. 

Mas o que podemos dizer sobre o problema da colinearidade? As diversas variaveis X nao estarao 
altamente correlacionadas, ja que sao potencias de XI Sim, mas lembre-se de que termos como X 2 , 
A 3 , A 4 etc. sao todos funpoes nao lineares de A e, portanto, estritamente falando, nao desrespeitam a 


FIGURA 7.1 

A curva em U de 
custo marginal. 


Y 



Produpao 
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EXEMPLO 7.4 

Estimativa da 
funcdo de custo 
total 


TABELA 7.4 

Custo total (Y) e 
produ^ao ( X ) 


FIGURA 7.2 

Curva de custo 
total. Custo total 
da produfao/ 
produ§ao. 


hipotese da ausencia de multicolinearidade. Em resumo, os modelos de regressao polinomial podem 
ser estimados com as tecnicas deste capftulo e nao apresentam novos problemas de estimagao. 


Como um exemplo da regressao polinomial, considere os dados sobre produfao e custo 
total de um bem no curto prazo apresentados na Tabela 7.4. Que tipo de modelo de regres¬ 
sao se ajustaria a esses dados? Para este proposito, vejamos primeiro o diagrama de dispersao 
da Figura 7.2. 

Com base na figura, fica claro que a relagao entre custo total e produgao assemelha-se a 
uma curva em S alongado; note como a curva de custo total primeiro aumenta gradualmen- 
te e depois, aceleradamente, como previsto pela famosa lei dos rendimentos decrescentes. A 
forma de 5 da curva de custo total pode ser capturada pelo seguinte modelo cubico ou poli- 
nomio de terceiro grau: 

Y, = ySo + Pi X, + ft 2 X , 2 + /S 3 X , 3 + ui (7.10.4) 

em que Y = custo total e X = produgao. 

Com base nos dados da Tabela 7.4, podemos aplicar o metodo dos MQO para estimar os 
parametros da Equagao (7.10.4). Mas, antes, vejamos o que a teoria economica diz a respeito 
da fungao cubica de custos a curto prazo (7.10.4). A teoria elementar dos pre^os mostra que, 
a curto prazo, as curvas de custo marginal (CM) e de custo medio (CMe) apresentam, de 
modo geral, forma de U — e inicialmente, tanto o CM quanto o CMe caem, mas depois 
de atingir determinado nfvel de produfao, as duas curvas voltam-se para cima em consequen- 
cia da ja mencionada lei dos rendimentos decrescentes. Isso pode ser visto na Figura 7.3 (veja 
tambem a Figura 7.1). E como as curvas de custos marginal e medio derivam da curva de 
custo total, a natureza dessa forma de U impoe algumas restrigoes aos parametros da curva 
de custo total (7.10.4). 


Produgao Custo total (em $) 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 
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EXEMPLO 7.4 

( Continuagao ) 

FIGURA 7.3 

de custo a curto 
prazo. 


y 



Na verdade, e possfvel demonstrar que os parametros de (7.10.4) devem atender as seguintes 
restrifoes para que se observe a tfpica forma de U das curvas de custo marginal e medio de 
curto prazo: 18 

1. 0o,0i, e fii > 0 

2. p 2 < 0 (7.10.5) 

3. /3f < 30103 

Toda essa discussao teorica pode parecer um tanto tediosa. Mas este conhecimento e extre- 
mamente util para o exame de resultados praticos, pois, se eles nao estiverem de acordo com as 
expectativas, supondo que nao tenhamos cometido um erro de especifica^ao (escolhido o mode- 
lo errado), teremos de modificar a teoria ou procurar uma nova teoria e recome^ar toda a inves¬ 
tigate. Mas, como observado na introduce, essa e a natureza de qualquer investigate. 

Resultados praticos. Ajustando uma regressao polinomial de terceiro grau aos dados da Tabe- 
la 7.4, obtemos os seguintes resultados: 

Y, = 141,7667 + 63,4776X, - 12,9615Xf + 0,9396Xf 

(6,3753) (4,7786) (0,9857) (0,0591) R 2 = 0,9983 (7.10.6) 

(Nota: os numeros entre parenteses sao os erros padrao estimados.) Embora examinaremos a 
significance estatfstica desses resultados no proximo capftulo, o leitor pode verificar desde ja 
que eles estao em conformidade com as expectativas teoricas listadas na Equate (7.10.5). 
Como um exerefeio, deixamos ao leitor a interpretato da regressao (7.10.6). 

Mais um exemplo economico do modelo de regressao polinomial e dado pelos seguintes 
resultados:TCPIB, = 5,5347 - 5,5788 PIBPCR + 2,8378 PIBPCR 2 

fCPTB, = 5,5347 - 5,5788 PIBPCR + 2,8378 PIBPCR 2 

ep = (0,2435) (1,5995) (1,4391) (7.10.7) 

R 2 = 0,1092 fl 2 aj = 0,0996 


Veja CHIANG, Alpha C. Fundamental methods of mathematical economics. 3. ed. Nova York: McGraw-Hill, 1984. 
p. 250-252. 
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EXEMPLO 7.5 

Taxa de 
crescimento do 
PIB e PIB per 
capita relativo 
para 2007em 
190 paises em 
desenvolvimen to 
(em bilhoes de 
dolares de 2000) 


Em que TCPIB = taxa de crescimento do PIB, % em 2007, e PIBPCR = TCP per capita relativo, 
em 2007 (como % do PIB per capita dos Estados Unidos, 2007). O R 2 ajustado ( R 2 aj) informa 
que, levando em conta o numero de regressores, o modelo explica apenas 9,96% da variagao da 
TCPIB. Mesmo o R 2 nao ajustado de 0,1092 parece baixo. Esses valores podem parecer desapon- 
tadores, mas, como mostraremos no proximo capftulo, esses R 2 baixos sao encontrados com 
frequencia em dados de corte transversal com grande numero de observances. Alem disso, ate 
um valor aparentemente baixo de R 2 pode ser estatisticamente significativo (isto e, diferente de 
zero), como mostraremos no proximo capftulo. 

Fonte: Indicadores de Desenvolvimento do Banco Mundial, ajustados para a base de 2000 e valores estimados, projetados e desenvolvidos 
pelo Economic Research Service. 


*7.11 Coeficientes de correlagao parcial 


Explica^ao de coeficientes de correlagao simples e parcial 

No Capitulo 3, apresentamos o coeficiente de correlagao r como uma medida do grau de associa¬ 
gao linear entre duas variaveis. No caso de um modelo de regressao com tres variaveis, podemos com- 
putar tres coeficientes de correlagao: r 12 (correlagao entre Y e X 2 ), r 13 (coeficiente de correlagao entre 
Y e V 3 ) e r 23 (coeficiente de correlagao entre X 2 e X 3 ). Note que por conveniencia estamos usando o 
subscrito 1 para representar Y. Esses coeficientes de correlanao sao denominados coeficientes de cor¬ 
relanao brutos ou simples ou, ainda, coeficientes de correlanao de ordem zero. Eles podem ser calcu- 
lados conforme a definigao dada na Equagao (3.5.13). 

Mas agora considere esta pergunta: sera que, digamos, r l2 , mede de fato o “verdadeiro” grau de 
associagao (linear) entre Y e X 2 quando uma terceira variavel, X 3 . pode estar associada as outras duas? 
Essa pergunta e analoga a seguinte: suponha que o verdadeiro modelo de regressao seja (7.1.1), mas 
que omitimos a variavel X 3 do modelo e apenas calculamos a regressao de Y contra X 2 , obtendo o 
coeficiente angular de, por exemplo, b l2 . Esse coeficiente sera igual ao verdadeiro coeficiente ft 2 que 
teriamos obtido ao estimarmos o modelo (7.1.1)? A resposta deve ser evidente com base no que foi 
dito na Segao 7.7. Em geral, r 12 nao refletira o verdadeiro grau de associagao entre Ye X 2 na presenga 
de X 2 . Na verdade, tende a dar uma impressao falsa da natureza da associagao entre Y e X 2 , como 
mostraremos em breve. O que precisamos e de um coeficiente de correlagao independente da influen- 
cia, se e que ela existe, de X 3 sobre Y e X 2 . Esse coeficiente de correlagao pode ser obtido e e conhecido 
como coeficiente de correlagao parcial. Conceitualmente, e semelhante ao coeficiente parcial de regres¬ 
sao. Definimos 

r, 2,3 = coeficiente de correlagao parcial entre Y e X 2 , mantendo X 3 constante 
r i 3,2 — coeficiente de correlagao parcial entre Y e X 3 , mantendo X 2 constante 
r 23 ,i — coeficiente de correlagao parcial entre X 2 e Xy mantendo Y constante 

Esses coeficientes de correlagao parcial podem ser facilmente obtidos por meio do coeficiente de 
correlagao simples ou de ordem zero (para uma demonstragao, veja os exercfcios ): 19 

r 12 ~ r l2 ,r 2 3 

,,2J " 7(i--•(=)(i-d,) 


*Opcional. 

19 Muitos programas de computador para analise de regressao multipla calculam rotineiramente os coeficientes 
de correlagao simples; a partir daf, e facil obter os coeficientes de correlagao parcial. 
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H3 ~ ^12^23 

-’'I;) <7 ' 11 ' 2) 

>~2 3 ~ U2U3 

yo-'-yo-’-w < 7ii - 3 > 

As correla 5 oes parciais dadas pelas Equagoes (7.11.1) a (7.11.3) sao chamadas de coeficientes de corre- 
lacao de primeira ordem. Por ordem entendemos o numero de subscritos secundarios. Assim, r , 2.34 seria o 
coeficiente de correla 9 ao de segunda ordem, r , 2,34 5 seria o coeficiente de correla^ao de terceira ordem 
e assim por diante. Como observado, r l2 , r j 3 e assim por diante sao denominados coeficientes de corre- 
lacuo simples ou de ordem zero. A interpreta 9 ao de, por exemplo, r j 2,34 e que ele nos da o coeficiente de 
correla 9 ao entre Y e X 2 , mantendo X 2 e X 4 constantes. 

Interpreta^ao dos coeficientes de correla^ao simples e parcial 

No caso de duas variaveis, o r simples tem um significado objetivo: mede o grau de associa 9 ao (linear) 
entre a variavel dependente Ye a unica variavel explanatoria, X. Mas, quando vamos alem do caso de duas 
variaveis, precisamos estarmuito atentos a interpreta 9 ao dos coeficientes de correla 9 ao simples. Na Equa- 
9 ao (7.11.1), por exemplo, observamos o seguinte: 

1. Mesmo se r [ 2 — 0, r 12> 3 nao sera igual a zero a menos que r 13 ou r 23 , ou ambos, sejam iguais a 
zero. 

2. Se r l2 = 0 e r 13 e r 23 forem diferentes de zero e apresentarem o mesmo sinal, r l2 >3 sera nega- 
tivo, mas, se apresentarem sinais contrarios, sera positivo. Um exemplo esclarecera isso. Seja 
Y — rendimento da colheita, X 2 — precipita 9 ao pluviometrica eX 3 = temperatura. Suponha que 
r 12 = 0, ou seja, que nao haja associa 9 ao entre rendimento da colheita e chuva. Suponha, ainda, 
que /■ j 3 seja positivo e r 23 , negativo. Como mostra a Equa 9 ao (7.11.1), rj 2 3 sera positivo, istoe, man¬ 
tendo a temperatura constante, ha uma associa 9 ao positiva entre rendimento e chuva. Esse resultado 
aparentemente paradoxal nao e surpreendente. Como a temperatura, A 3 , afeta tanto o rendimento Y 
quanto a precipita 9 ao pluviometrica X 2 , para encontrarmos a rela 9 ao lfquida entre rendimento da 
colheita e chuva, precisamos remover a influencia da variavel “incomoda” temperatura. Esse 
exemplo mostra como podemos ser enganados pelo coeficiente de correla 9 ao simples. 

3. Os termos r 12 3 e r l2 (e compara 9 oes semelhantes) nao precisam ter o mesmo sinal. 

4. No caso de duas variaveis, vimos que r 2 situa-se entre 0 e 1. A mesma propriedade e valida para o 
quadrado dos coeficientes de correla 9 ao parcial. Usando esse fato, o leitor pode verificar que e 
posslvel obter a seguinte expressao por meio da Equa 9 ao (7.11.1): 

0 ^ di + 'n + r 2 2 3 - 2ri 2 ri 3 r 23 < 1 (7.11.4) 

que nos da as inter-rela 9 oes entre os tres coeficientes de correla 9 ao de ordem zero. Expressoes 
semelhantes podem ser obtidas com base nas Equa 9 oes (7.11.2) e (7.11.3). 

5. Suponha que r 13 = r 23 = 0. Isso significa que r 12 tambem e zero? A resposta e obvia a partir da 
Equa 9 ao (7.11.4). O fato de Y, X 2 , X 2 eX 3 nao serem correlacionados, nao significa que Y e X 2 nao 
sao correlacionados. 

Note que a expressao r\ 2 3 pode ser denominada coeficiente de determina 9 ao parcial e pode ser 
interpretada como a propor 9 ao da varia 9 ao de Y nao explicada pela variavel X 3 que foi explicada 
pela inclusao de X 2 no modelo (veja o Exercfcio 7.5). Conceitualmente, e semelhante a R 2 . 

Antes de prosseguir, observe as seguintes redoes entre o R 2 , os coeficientes de correla 9 ao sim¬ 
ples e os coeficientes de correla 9 ao parcial: 

^2 = r \2 + ^1 2 3 ~ 2r l 2 r 13^23 


( 7 . 11 . 5 ) 
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Resumo e 
conclusoes 


EXERCICIOS 
TABELA 7.5 


R 2 3 4 5 = r* 2 + (l-r? 2 )rf 3i 2 (7.11.6) 

r1 = r 2 n + (l - r 2 u ) r 2 23 (7.11.7) 

Ao concluirmos esta segao, pensemos no seguinte: afirmamos anteriormente que R 1 nao diminui 
quando se inclui uma variavel explanatoria no modelo, o que pode ser visto com base na Equagao 
(7.11.6). Essa equagao informa que a proporgao da variagao de Y explicada conjuntamente por X 2 e 
X 3 ea soma de duas partes: a parte explicada apenas por X 2 (— r\ 2 ) e a parte nao explicada por 
X 2 ( = 1 — r 2 , 2 ) multiplicada pela proporgao explicada por X 3 depois de manter a influencia de X 2 
constante. Agora, R 2 > r\ 2 desde que r j 3 _ 2 > 0. Na pior das hipoteses sera igual a zero, caso em que 
R 2 = rj 2 . 


1. Este capitulo apresentou o mais simples dos modelos de regressao miiltipla, especificamente, o mo¬ 
delo de regressao de tres variaveis. Entende-se que o termo linear refere-se a linearidade dos parame- 
tros, e nao necessariamente a das variaveis. 

2. Embora, sob muitos aspectos, o modelo de regressao com tres variaveis seja uma extensao do 
modelo de duas variaveis, ha alguns conceitos novos envolvidos, tais como os coeficientes parciais 
de regressao, os coeficientes de correlaqdoparcial, o coeficiente de correlaqcio miiltipla, os R 2 ajusta- 
dos e nao ajustados (pelos graus de liberdade), a multicolinearidade e o vies de especificaqdo. 

3. Este capitulo tambem considerou a forma funcional do modelo de regressao miiltipla, como a funqdo 
de produqao Cobb-Douglas e o modelo de regressao polinondaL 

4. Embora o R 2 e o R 2 ajustado sejam medidas gerais da qualidade do ajustamento do modelo a um 
dado conjunto de dados, sua importancia nao deve ser exagerada. O fundamental sao as expectati- 
vas teoricas subjacentes sobre o modelo em termos de sinais a priori dos coeficientes das variaveis 
que entram no modelo e, como mostraremos no proximo capitulo, sua significancia estatistica. 

5. Os resultados apresentados neste capitulo podem ser facilmente generalizados para um modelo 
de regressao linear miiltipla com qualquer niimero de regressores. Mas a algebra toma-se muito 
tediosa. Esse tedio pode ser evitado recorrendo-se a algebra matricial. Para o leitor interessado, a 
extensao para o modelo de regressao com k variaveis usando algebra matricial e apresentada no 
Apendice C, que e opcional. Mas o leitor em geral pode ler o restante do livro sem conhecer 
muita algebra matricial. 


7.1. Considere os dados da Tabela 7.5. 


Y 

*2 

*3 

1 

1 

2 

3 

2 

1 

8 

3 

-3 


Com base nesses dados, estime as seguintes regressoes: 


= «i + ot 2 X 2 i + u\i 

(1) 

= A.i + X 3 X 3 i + u 2 i 

(2) 

- + fi 2 X 2 i + p 3 X 3i + uj 

(3) 


Nota: estime apenas os coeficientes, nao os erros padrao. 
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a. a 2 — fi 2 l Justifique sua resposta. 

b. = /J 3 ? Justifique sua resposta. 

Que conclusao importante voce tira deste exercicio? 

7.2. Com base nos dados a seguir, estime os coeficientes parciais de regressao, seus erros padrao e 
os valores de R 2 ajustado e nao ajustado: 


7 = 367,693 
Y^(Y, - Y) 2 = 66042,269 
- X 3 ) 2 = 280,000 
E( 7 ' - ?){X 3i - X 3 ) = 4250,900 


A 2 = 402,760 X 3 = 8,0 
- X 2 f = 84855,096 
- Y)(X 2l - X 2 ) = 74778,346 

E^ - X 2 )(X 3l - X 3 ) = 4796,000 

n = 15 


7.3. Mostre que a Equagao (7.4.7) tambem pode ser expressa como: 
a = T,yj( x 2i - b 23 x 3i ) 

2 E( x 2, - b 23 X 3i ) 2 

covariagao liquida (de x 3 ) entre v e x 2 
variagao liquida (dex 3 ) cm x 2 

Onde b 23 e o coeficiente angular da regressao de X 2 contra X 3 . ( Dica: lembre-se de que 
b 23 = X>2,x 3 ,7E4-) 

7.4 Sabendo que, em um modelo de regressao multipla, o termo de erro «, tem a distribuigao de proba- 
bilidade u i ~ N( 0, 4), como voce montaria um experimento de Monte Carlo para verificar que a 
variancia verdadeira e de fato igual a 4? 

7.5 Mostre que rp, 3 = ( R 2 — r j 3 )/(l — r j 3 ) e interprete a equagao. 

7.6 Se a relagao a 3 X 1 + a 2 X 2 + a 3 X 3 = 0 for valida para todos os valores de X h X 2 e X 3 , obtenha 
os valores dos tres coeficientes de correlagao parcial. 

7.7. E possivel obter os seguintes resultados a partir de um conjunto de dados? 

a. r 23 — 0,9, r 13 = —0,2, r l2 — 0,8 

b. r l2 — 0,6, r 23 = —0,9, r 31 = —0,5 

c. r 2l — 0,01, r 13 = 0,66, r 23 — —0,7 

7.8. Considere o seguinte modelo: 

Yj — + /l 2 Escolaridade, + / 6 2 Anos de experiencia + u t 

Suponha que voce deixe de fora do calculo a variavel anos de experiencia. Que tipos de problemas 
ou vieses voce esperaria encontrar? Explique verbalmente. 

7.9. Mostre que, em (7.9.2), /J 2 e /J 3 representam, de fato, as elasticidades do produto em relagao ao 
trabalho e ao capital. (Esta pergunta pode ser respondida sem recorrer ao calculo; basta recordar 
a definigao do coeficiente de elasticidade e lembrar que a variagao do logaritmo de uma variavel 
e uma mudanga relativa, supondo que as variagoes sejam bem pequenas.) 

7.10. Considere o modelo de regressao com tres variaveis discutido neste capitulo. 

a. Suponha que voce multiplique todos os valores de X 2 por 2. Qual sera o efeito dessa mudan¬ 
ga de escala, se existir algum, sobre a estimativa dos parametros e seus erros padrao? 

b. Agora, em vez de (a), suponha que todos os valores de 7 sejam multiplicados por 2. Qual sera 
o efeito dessa mudanga de escala, se existir algum, sobre a estimativa dos parametros e seus 
erros padrao? 

7.11 Em geral, R 2 ± r 2 2 + r 2 y mas isso so acontece se r 23 — 0. Comente e destaque a importancia 
deste resultado. {Dica: veja a Equagao (7.11.5).) 
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7.12 Considere os seguintes modelos: 

Modelo A: Y t — c q T T ^ 3 ^ 3 / “t~ ffi? 

Modelo B: (7, — X 2t ) — Pi + P 2 X 2 + Pi^ 3 t + u 2 t 

a. As estimativas de MQO de a.\ e serao as mesmas? Por que? 

b. As estimativas de MQO de « 3 e /) 3 serao as mesmas? Por que? 

c. Qual e a relapao entre a 2 e /V? 

d. Voce pode comparar os R 2 dos dois modelos? Justifique sua resposta. 

7.13. Suponha que voce estime a funcfio consumo* 

Y[ — «[ + «2 Xj + Mj; 

e a funcao poupanpa 

Z, = Pi + ftZ, + «2; 

onde 7 = consumo, Z = poupan 5 a, X = renda tX—Y+Z, isto e, a renda e igual a consumo 
mais poupanca. 

a. Qual e a relayao, se existir, entre a 2 e Pi - Mostre seus calculos. 

b. A soma dos quadrados dos residuos, SQR, sera igual nos dois modelos? Explique. 

c. Voce pode comparar o R 2 dos dois modelos? Explique. 

7.14. Suponha que voce expresse o modelo Cobb-Douglas dado na Equa§ao (7.9.1) da seguinte 
forma: 

7, = PiX%X* Ui 

Aplicando a este modelo a transforma 5 ao logaritmica, voce tera In ;/,■ como termo de erro do lado 
direito da equa 5 ao. 

a. Que hipoteses probabillsticas voce deve fazer a respeito de In para poder aplicar o mo¬ 
delo classico normal de regressao linear? Como voce testaria isso em relac^ao aos dados da 
Tabela 7.3? 

b. As mesmas hipoteses se aplicam a m,? Justifique sua resposta. 

7.15. Regressao que passa pela origem. Considere a seguinte regressao que passa pela origem: 

Yj = P 2 X 2 i + P 3 X 2 i + U i 

a. O que e necessario fazer para estimar as incognitas? 

b. Para este modelo, u, sera zero? Justifique sua resposta. 

c. Para este modelo, ^ u , X 2 i = ^UiX 2i = 0? 

d. Em que caso voce usaria este modelo? 

e. E possivel generalizar os resultados para um modelo com k variaveis? ( Dica: reveja a discus- 
sao sobre duas variaveis no Capltulo 6.) 

Exercfcios aplicados 

7.16. A demanda por rosasP A Tabela 7.6 apresenta dados trimestrais relativos as seguintes variaveis: 


* Adaptado de CHAREMZA, Wojciech W.; DEADMAN, Derek F. Econometric practice: general to specific modelling 
cointegration and vector autogression. Brookfield, Vermont: Edward Elgar, 1992. p. 18. 
t Adaptado de KENNEDY, Peter. A guide to econometrics. 3. ed. Cambridge, Massachusetts: The MIT Press, 1992, 
p. 308, pergunta n. 9. 

t Agradepo a Joe Walsh pela coleta destes dados com um grande atacadista da area metropolitana de Detroit e 
pelo subseqente processamento das informapoes. 
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Y = quantidade de rosas vendidas, em duzias 
X 2 — prego medio das rosas no atacado, $/diizia 
X j — prego medio dos cravos no atacado, $/duzia 
X 4 — renda media familiar disponivel, $/semana 

X 5 — variavel de tendencia, com valores de 1, 2 e assim por diante, para o perfodo entre o ter- 
ceiro trimestre de 1971 e o segundo trimestre de 1975 na area metropolitana de Detroit. 
Considere as seguintes fungoes de demanda: 

Yj — C(]+ 0.2tX-2t + &iX 2t + a 4 X 4t + C< 5 X 5 t -\~Uf 
In Y, — p x + p 2 lnX 2 ,+ Pi IrX?? + Pa InXt, + /I 5 X 5 , u, 

a. Estime os parametros do modelo linear e interprete os resultados. 

b. Estime os parametros do modelo log-linear e interprete os resultados 

c. Pi, Pi e P 4 dao, respectivamente, as elasticidades-prego propria, prego cruzada e renda da de¬ 
manda. Quais seus sinais a priori ? Os resultados obtidos confirmam as expectativas a priori ? 

d. Como voce calcularia as elasticidades-prepo propria, prego cruzada e renda do modelo linear? 

e. Com base em sua analise, qual dos modelos escolheria e por que? 


TABELA 7.6 

Demanda trimestral 

Ano 

Y 

x 2 

*3 

x 4 

*5 

por rosas na area 

1971-111 

11.484 

2,26 

3,49 

158,11 

1 

metropolitana de 

-IV 

9.348 

2,54 

2,85 

173,36 

2 

Detroit de 1971 -III a 

1972-1 

8.429 

3,07 

4,06 

165,26 

3 

1975-11 

-II 

10.079 

2,91 

3,64 

1 72,92 

4 


-III 

9.240 

2,73 

3,21 

1 78,46 

5 

-IV 

8.862 

2,77 

3,66 

198,62 

6 

1973-1 

6.216 

3,59 

3,76 

186,28 

7 

-II 

8.253 

3,23 

3,49 

188,98 

8 

-III 

8.038 

2,60 

3,13 

180,49 

9 

-IV 

7.476 

2,89 

3,20 

183,33 

10 

1974-1 

5.911 

3,77 

3,65 

181,87 

11 

-II 

7.950 

3,64 

3,60 

185,00 

12 

-III 

6.134 

2,82 

2,94 

184,00 

13 

-IV 

5.868 

2,96 

3,12 

188,20 

14 

1975-1 

3.160 

4,24 

3,58 

175,67 

15 

-II 

5.872 

3,69 

3,53 

188,00 

16 


7.17. Atividades de prospecgao de petroleo. Os pogos experimentais sao perfurados para encontrar e ex- 
trair petroleo e/ou gas em uma area expandida ou para encontrar novos reservatorios em areas 
conhecidas como produtivas ou para ampliar os limites de reservatorios existentes. A Tabela 7.7 
apresenta dados relativos as seguintes variaveis: 

Y — ntimero de pogos experimentais perfurados 

X 2 — prego do petroleo na boca do pogo no perfodo anterior (em dolares constantes, 1972 = 100) 
X 3 — produgao interna 

X 4 — PNB (em dolares constantes 1972 = 100) 

X 5 — variavel de tendencia, 1948 = 1, 1949 — 2,..., 1978 = 31 
Verifique se o seguinte modelo ajusta-se aos dados: 

Yt = P\+ PiX 2t + Pi lnX3, + ^4X4; + PsX^ + Ut 


Agradego a Raymond Savino pela coleta e processamento dos dados. 
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TABELA 7.7 

Prospecgao de pogos 
experimentais 

Fonte: Energy Information 
Administration, 1978 
Report to Congress. 


Milhares 

Prefo do barril 

Produfao 

interna 

PNB (em 


de po^os 

(em $ 

(milhoes de 

bilhoes de 


experimentais 

constante) 

barris/dia) 

$ constantes) 

Tempo 

(P) 

(* 2 ) 

(X 3 ) 

(* 4 ) 

(*s) 

8,01 

4,89 

5,52 

487,67 

1948= 1 

9,06 

4,83 

5,05 

490,59 

1949= 2 

10,31 

4,68 

5,41 

533,55 

1950= 3 

11,76 

4,42 

6,16 

576,57 

1951 = 4 

12,43 

4,36 

6,26 

598,62 

1952= 5 

13,31 

4,55 

6,34 

621,77 

1953 = 6 

13,10 

4,66 

6,81 

613,67 

1954= 7 

14,94 

4,54 

7,15 

654,80 

1955 = 8 

16,17 

4,44 

7,17 

668,84 

1956= 9 

14,71 

4,75 

6,71 

681,02 

1957= 10 

13,20 

4,56 

7,05 

679,53 

1958= 11 

13,19 

4,29 

7,04 

720,53 

1959= 12 

11,70 

4,19 

7,18 

736,86 

1960= 13 

10,99 

4,17 

7,33 

755,34 

1961 = 14 

10,80 

4,11 

7,54 

799,15 

1962= 15 

10,66 

4,04 

7,61 

830,70 

1963 = 16 

10,75 

3,96 

7,80 

874,29 

1964= 17 

9,47 

3,85 

8,30 

925,86 

1965 = 18 

10,31 

3,75 

8,81 

980,98 

1966= 19 

8,88 

3,69 

8,66 

1.007,72 

1967= 20 

8,88 

3,56 

8,78 

1.051,83 

1968= 21 

9,70 

3,56 

9,18 

1.078,76 

1969= 22 

7,69 

3,48 

9,03 

1.075,31 

1970= 23 

6,92 

3,53 

9,00 

1.107,48 

1971 = 24 

7,54 

3,39 

8,78 

1.171,10 

1972= 25 

7,47 

3,68 

8,38 

1.234,97 

1973 = 26 

8,63 

5,92 

8,01 

1.217,81 

1974= 27 

9,21 

6,03 

7,78 

1.202,36 

1975 = 28 

9,23 

6,12 

7,88 

1.271,01 

1976= 29 

9,96 

6,05 

7,88 

1.332,67 

1977 = 30 

10,78 

5,89 

8,67 

1.385,10 

1978= 31 


a. Voce pode mostrar a logica a priori deste modelo? 

b. Supondo que o modelo seja aceitavel, estime os parametros do modelo e seus erros padrao e 
obtenha R 2 e R 2 . 

c. Comente os resultados obtidos em relayao a suas expectativas previas. 

d. Que outra especificac^ao voce sugeriria para explicar a atividade de prospecc^ao? Por que? 
7.18. Gustos orcamentdrios com defesa, Estados Unidos, 1962-1981. Para explicar o or 9 amento com 

defesa dos Estados Unidos, voce deve examinar o seguinte modelo: 

Yt = P 1 + PiXit + fiiXi, + X 4t + PsX it + u, 
em que Y, — Gastos o^amentarios com defesa no ano t, em bilhoes de $ 

X 2 , = PNB do ano t, em bilhSes de $ 

X 2 , — vendas/assistencia militar dos Estados Unidos no ano t, em bilhoes de $ 

X 4t — vendas da indiistria aeroespacial, em bilhoes de $ 

X 5t — conflitos militares envolvendo mais de 100 mil soldados. Esta variavel assume 
o valor 1 quando 100 mil ou mais soldados estao envolvidos e e igual a 0 quando 
esse numero e inferior a 100 mil. 
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Para testar o modelo, use os dados da Tabela 7.8. 

a. Estime os parametros do modelo e seus erros padrao e obtenha R 2 , R 2 modificado e R 2 . 

b. Comente os resultados levando em conta quaisquer expectativas a priori que tenha quanto 
a relagao entre Y e as diversas variaveis X. 

c. Que outra(s) variavel(is) voce incluiria no modelo e por que? 


TABELA 7.8 

Gastos orgamentarios 
com defesa 1962- 
-1981 



Gastos 


Vendas/assistencia 

Vendas da 

Conflitos, 


orgamentarios 


militar dos 

industria 

100 mil e 


com defesa 

PNB 

Estados Unidos 

aeroespacial 

mais + 

Ano 

(n 

(* 2 ) 

(* 3 ) 

(* 4 ) 

(*s) 

1962 

51,1 

560,3 

0,6 

16,0 

0 

1963 

52,3 

590,5 

0,9 

16,4 

0 

1964 

53,6 

632,4 

1,1 

16,7 

0 

1965 

49,6 

684,9 

1,4 

17,0 

1 

1966 

56,8 

749,9 

1,6 

20,2 

1 

1967 

70,1 

793,9 

1,0 

23,4 

1 

1968 

80,5 

865,0 

0,8 

25,6 

1 

1969 

81,2 

931,4 

1,5 

24,6 

1 

1970 

80,3 

992,7 

1,0 

24,8 

1 

1971 

77,7 

1.077,6 

1,5 

21,7 

1 

1972 

78,3 

1.185,9 

2,95 

21,5 

1 

1973 

74,5 

1.326,4 

4,8 

24,3 

0 

1974 

77,8 

1.434,2 

10,3 

26,8 

0 

1975 

85,6 

1.549,2 

16,0 

29,5 

0 

1976 

89,4 

1.718,0 

14,7 

30,4 

0 

1977 

97,5 

1.918,3 

8,3 

33,3 

0 

1978 

105,2 

2.163,9 

11,0 

38,0 

0 

1979 

117,7 

2.417,8 

13,0 

46,2 

0 

1980 

135,9 

2.633,1 

15,3 

57,6 

0 

1981 

162,1 

2.937,7 

18,0 

68,9 

0 


Fonte: os dados, de diversas publicagoes do governo, foram coletados por Albert Lucchino. 


7.19. Demanda por frangos nos Estados Unidos, 1960-1982. Para estudar o consumo per capita de 
frango nos Estados Unidos, use os dados da Tabela 7.9, 
em que Y — consumo per capita de frango em libras (peso) 

X 2 — renda real dispomvel per capita , em $ 

Xj — prego real do frango no varejo, em centavos de dolar por libra (peso) 0 
X 4 — prego real da carne suina no varejo, em centavos de dolar por libra (peso) 0 
X 5 — prego real da carne bovina no varejo, em centavos de dolar por libra (peso) 0 
X (> — prego real dos substitutes da carne de frango, em centavos de dolar por libra 
(peso), 0 , que e uma media ponderada dos pregos reais das carnes suina e bovina, 
usando como pesos o consumo relativo de cada uma dessas carnes em relagao ao 


consumo total delas. 

Agora, considere as seguintes fungoes de demanda: 

In Y, = ot\ + ot 2 In X 2 i + ot 2 In X 2l + Ut ( 1 ) 

In Y, = yi+ y 2 lnX 2t + y 3 \nX it + y 4 In X 4t + u, (2) 

In Y t = k i + k 2 In X 2t + k 2 In X 2t + k 4 In X$ t + u t (3) 

In Yi = 0\ + 0 2 \nX 2t + In X 2 i + 0 4 In X 4 t + 0 5 In X^t + Ut ( 4 ) 

In Y, = f)\ + /3 2 lnX 2t + /I 3 lnX 2 , + /3 4 \nX(, t + u t (5) 


Da teoria microeconomica, sabe-se que a demanda por um bem depende, em geral, da renda 
real do consumidor, do prego real do bem e dos pregos reais de bens complementares ou substi¬ 
tutes. Tendo em vista esses aspectos, responda as seguintes perguntas: 
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TABELA 7.9 

Demanda por frangos 
nos Estados Unidos, 
1960-1982 

Fonte: os dados relativos a Y 
sao da Citibase e os relativos 
as variaveis de X 2 a X 6 sao 
do Departamento de Agri¬ 
culture dos Estados Unidos. 
Agradego a Robert J. Fisher 
pela coleta dos dados e pela 
analise estatfstica. 


Ano 

Y 

x 2 

X 3 

x 4 

x 5 

x 6 

1960 

27,8 

397,5 

42,2 

50,7 

78,3 

65,8 

1961 

29,9 

413,3 

38,1 

52,0 

79,2 

66,9 

1962 

29,8 

439,2 

40,3 

54,0 

79,2 

67,8 

1963 

30,8 

459,7 

39,5 

55,3 

79,2 

69,6 

1964 

31,2 

492,9 

37,3 

54,7 

77,4 

68,7 

1965 

33,3 

528,6 

38,1 

63,7 

80,2 

73,6 

1966 

35,6 

560,3 

39,3 

69,8 

80,4 

76,3 

1967 

36,4 

624,6 

37,8 

65,9 

83,9 

77,2 

1968 

36,7 

666,4 

38,4 

64,5 

85,5 

78,1 

1969 

38,4 

717,8 

40,1 

70,0 

93,7 

84,7 

1970 

40,4 

768,2 

38,6 

73,2 

106,1 

93,3 

1971 

40,3 

843,3 

39,8 

67,8 

104,8 

89,7 

1972 

41,8 

911,6 

39,7 

79,1 

114,0 

100,7 

1973 

40,4 

931,1 

52,1 

95,4 

124,1 

113,5 

1974 

40,7 

1.021,5 

48,9 

94,2 

127,6 

115,3 

1975 

40,1 

1.165,9 

58,3 

123,5 

142,9 

136,7 

1976 

42,7 

1.349,6 

57,9 

129,9 

143,6 

139,2 

1977 

44,1 

1.449,4 

56,5 

117,6 

139,2 

132,0 

1978 

46,7 

1.575,5 

63,7 

130,9 

165,5 

132,1 

1979 

50,6 

1.759,1 

61,6 

129,8 

203,3 

154,4 

1980 

50,1 

1.994,2 

58,9 

128,0 

219,6 

174,9 

1981 

51,7 

2.258,1 

66,4 

141,0 

221,6 

180,8 

1982 

52,9 

2.478,7 

70,4 

168,2 

232,6 

189,4 


Nota: os pregos reais foram obtidos dividindo-se os pregos nominais pelo 1PC para alimentos. 


a. Qual das fungoes de demanda dentre as apresentadas voce escolheria e por que? 

b. Como interpretaria os coeficientes de In X 2t e In X 3t nesses modelos? 

c. Qual a diferen 9 a entre as especifica 9 oes (2) e (4)? 

d. Quais os problemas voce preve se adotasse a especificac^ao (4)? ( Dica: os pre 90 s das carnes 
srn'na e bovina estao inclufdos no pre 90 do frango.) 

e. Como a especificac^ao (5) inclui o pre 90 ponderado das carnes bovina e suina, seria preferlvel 
usar a funijao de demanda (5) em lugar da (4)? Por que? 

f. As carnes suina e/ou bovina substituem ou concorrem com a de frango? Como voce 
sabe? 

g. Suponha que a funpao (5) e a funpao de demanda “correta”. Estime os parametros desse 
modelo, calcule seus erros padrao, R 2 , R 2 e R 2 modificado. Interprete os resultados. 

h. Suponha agora que voce calculou o modelo “incorreto” (2). Avalie as consequencias desse 
erro de especificafao considerando os valores de y 2 e y 3 em rela£ao a fi 2 e ft 2 , respectivamente. 
(Dica: preste aten£ao na discussao da Seijao 7.7.) 

7.20. Em um estudo sobre a rotatividade no mercado de trabalho, James F. Ragan, Jr. obteve os seguintes 

resultados para a economia norte-americana no perfodo que vai do primeiro trimestre de 1950 ao 

quarto trimestre de 1979.* (Os dados entre parenteses sao a estatistica t estimada.) 

lnF, = 4,47 - 0,34 In X 2t + 1,22 In X 3t + l,22 1nX 4( 

(4,28) (-5,31) (3,64) (3,10) 

+ 0,80 In - 0,0055 X 6t R 2 - 0,5370 
(1,10) (-3,09) 


Fonte: veja o artigo de Ragan: "Turnover in the labor market: a study of quit and layoff rates." Economic Review, 
Federal Reserve Bank de Kansas City, maio 1981, p. 1 3-22, pag 223. 
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Nota: discutiremos a estatfstica t no proximo capftulo. 

em que Y — taxa de saida no setor de transformagao, definida como o numero de pessoas que 
saem voluntariamente da empresa por 100 empregados 
X 2 — variavel instrumental ou proxy para a taxa de desemprego masculino 
X 3 — percentual de empregados com menos de 25 anos 

X 4 — N,_ |//V / _4 = razao do emprego no setor no trimestre (t — 1) em relagao aos do 
trimestre (f — 4) 

X 5 — percentual de mulheres empregadas 

X 6 — tendencia temporal (l 2 trimestre de 1950 = 1) 

a. Interprete os resultados anteriores. 

b. A relagao negativa observada entre os logaritmos de Y e de X 2 e justificavel a priori ? 

c. Por que o coeficiente de In X 3 e positivo? 

d. Como o coeficiente de tendencia e negativo, ha um declinio secular na taxa percentual de 
saida do emprego e, em caso afirmativo, por que ha esse declinio? 

e. OR 2 e. baixo “demais”? 

f. Voce pode estimar os erros padrao dos coeficientes por meio dos dados disponiveis? Justifi- 
que sua resposta. 

7.21. Considere a seguinte funcao de demanda por moeda dos Estados Unidos no perfodo 1980-1998: 

M, = ^r/VV" 

em que M = demanda real por moeda, usando M2 como defini?ao de moeda 
Y — P1B real 
r — taxa dej uros 

Essa fungao de demanda por moeda pode ser estimada por meio dos dados da Tabela 7.10. 


TABELA 7.10 

Ano 

PIB 

M2 

IPC 

TjLP 

TJCP 

Demanda por moeda 
nos Estados Unidos, 
1980-1998 

1980 

2795,6 

1600,4 

82,4 

11,27 

11,506 

1981 

1982 

3131,3 

3259,2 

1 756,1 
1911,2 

90,9 

96,5 

13,45 

12,76 

14,029 

10,686 

Fonte: Economic Report of 

1983 

3534,9 

2127,8 

99,6 

11,18 

8,630 

the President, 2000, Tabelas 

B-l, B-58, B-67 e B-71. 

1984 

3932,7 

2311,7 

103,9 

12,41 

9,580 

1985 

4213,0 

2497,4 

107,6 

10,79 

7,480 


1986 

4452,9 

2734,0 

109,6 

7,78 

5,980 


1987 

4742,5 

2832,8 

113,6 

8,59 

5,820 


1988 

5108,3 

2995,8 

118,3 

8,96 

6,690 


1989 

5489,1 

3159,9 

124,0 

8,45 

8,120 


1990 

5803,2 

3279,1 

130,7 

8,61 

7,510 


1991 

5986,2 

3379.8 

136,2 

8,14 

5,420 


1992 

6318,9 

3434,1 

140,3 

7,67 

3,450 


1993 

6642,3 

3487,5 

144,5 

6,59 

3,020 


1994 

7054,3 

3502,2 

148,2 

7,37 

4,290 


1995 

7400,5 

3649,3 

152,4 

6,88 

5,510 


1996 

7813,2 

3824,2 

156,9 

6,71 

5,020 


1997 

8300,8 

4046,7 

160,5 

6,61 

5,070 


1998 

8759,9 

4401,4 

163,0 

5,58 

4,810 


Notas: PIB: produto interao bruto, em bilhoes de $. 

M 2 : oferta de moeda no conceito de M 2 . 

IPC: Indice de Pre^os ao Consumidor dos Estados Unidos (1982-1984 = 100). 
TJLP: taxa de juros de longo prazo (Tftulos do Tesouro de 30 anos). 

TJCP: taxa das Letras do Tesouro de tres meses (% ao ano). 
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Nota: para converter os valores nominais em valores reais, divida Me o PIB pelo IPC (indice de 
prefos ao consumidor dos Estados Unidos). Nao ha necessidade de dividir a variavel “taxa de 
juros” pelo IPC. Note, ainda, que apresentamos duas taxas de juros: uma de curto prazo, medida 
pela taxa das Letras do Tesouro de tres meses, e uma de longo prazo, medida pelo rendimento 
dos Tltulos do Tesouro de 30 anos, pois estudos anteriores empregaram esses dois tipos de ta¬ 
xas de juros. 

a. Com base nos dados, estime a fun£ao de demanda. Quais as elasticidades renda e taxa de 
juros da demanda por moeda? 

b. Suponha que, em vez de estimar a fun£ao de demanda, voce tivesse de ajustar a luncao 

( M/Y), — Interprete os resultados. Mostre os calculos necessarios. 

c. Como voce decidiria qual a melhor especifica 9 ao? {Nota: um teste estatfstico formal sera visto 
no Capltulo 8.) 

7.22. ATabela 7.11 apresenta dados relativos ao setor de transformagao grego no perlodo 1961-1987. 

a. Verifique se a fun 9 ao de produ 9 ao Cobb-Douglas ajusta-se aos dados da tabela e interprete 
os resultados. Que conclusao geral voce tira? 

b. Agora, considere o seguinte modelo: 

Produto/trabalho = A(K/L/ e u 

em que o regressando representa a produtividade do trabalho e o regressor a rela£ao capital/tra- 
balho. Qual o significado economico dessa relacjao, se existe algum? Estime os parametros 
desse modelo e interprete os resultados. 


TABELA 7.11 

Setor industrial grego 

Fonte: agradego a George 
K. Zestos, da Christopher 
Newport University, 
Virginia, pelos dados. 


Observagao 

Produfao* 

Capital 

Trabalho 1 ' 

Relagao 

capital/trabalho 

1961 

35,858 

59,600 

637,0 

0,0936 

1962 

37,504 

64,200 

643,2 

0,0998 

1963 

40,378 

68,800 

651,0 

0,1057 

1964 

46,147 

75,500 

685,7 

0,1101 

1965 

51,047 

84,400 

710,7 

0,1188 

1966 

53,871 

91,800 

724,3 

0,1267 

1967 

56,834 

99,900 

735,2 

0,1359 

1968 

65,439 

109,100 

760,3 

0,1435 

1969 

74,939 

120,700 

777,6 

0,1552 

1970 

80,976 

132,000 

780,8 

0,1691 

1971 

90,802 

146,600 

825,8 

0,1775 

1972 

101,955 

162,700 

864,1 

0,1883 

1973 

114,367 

180,600 

894,2 

0,2020 

1974 

101,823 

197,100 

891,2 

0,2212 

1975 

107,572 

209,600 

887,5 

0,2362 

1976 

11 7,600 

221,900 

892,3 

0,2487 

1977 

123,224 

232,500 

930,1 

0,2500 

1978 

130,971 

243,500 

969,9 

0,2511 

1979 

138,842 

257,700 

1006,9 

0,2559 

1980 

135,486 

274,400 

1020,9 

0,2688 

1981 

133,441 

289,500 

1017,1 

0,2846 

1982 

130,388 

301,900 

1016,1 

0,2971 

1983 

130,615 

314,900 

1008,1 

0,3124 

1984 

1 32,244 

327,700 

985,1 

0,3327 

1985 

137,318 

339,400 

977,1 

0,3474 

1986 

137,468 

349,492 

1007,2 

0,3470 

1987 

135,750 

358,231 

1000,0 

0,3582 


*Bilhoes de dracmas a pregos constantes de 1970. 
tMilhares de trabalhadores/ano. 
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7.23. Experimento de Monte Carlo. Considere o seguinte modelo: 

Yi = P i + fiiXii + + Ui 

Sabendo que — 262, p 2 — —0,006, p 2 — —2,4, a 1 — 42 e Uj~N(0, 42), gere dez conjuntos de 
64 observa£des sobre u, da distribu^ao normal dada e use as 64 observa£des da Tabela 6.4, em 
que Y — MI, X 2 = PNB/?c e X 3 ~ TAF, para gerar dez conjuntos de coeficientes ft (cada conjunto 
deve ter os tres parametros estimados). Tome as medias de cada coeficiente ft estimado e rela- 
cione-as aos verdadeiros valores dos coeficientes. Que conclusoes gerais voce tira dai? 

7.24. A Tabela 7.12 apresenta dados sobre despesa real de consumo, renda real, riqueza real e taxas 
reais de juros para os Estados Unidos no perfodo 1947-2000. Esses dados serao utilizados 
novamente no Exercfcio 8.35. 

a. Com os dados da tabela, estime a fun£ao consumo linear usando as variaveis renda, rique¬ 
za e a taxa de juros. Qual a equac^ao ajustada? 

b. O que os coeficientes estimados indicam sobre a relac^ao entre as variaveis e as despesas de 
consumo? 


TABELA 7.12 

Ano 

C 

RD 

Riqueza nominal 

Taxa de juros 

Despesa real de 

1947 

976,4 

1035,2 

5166,8 

-10,351 


1948 

998,1 

1090,0 

5280,8 

-4,720 

riqueza real e taxas 

1949 

1025,3 

1095,6 

5607,4 

1,044 

Estados Unidos no 

1950 

1090,9 

1192,7 

5759,5 

0,407 

perfodo 1947-2000. 

1951 

1107,1 

1227,0 

6086,1 

-5,283 


1952 

1142,4 

1266,8 

6243,9 

-0,277 

Fonte: C, RD e indices de 

1953 

1197,2 

1327,5 

6355,6 

0,561 

pregos encadeados 

1954 

1221,9 

1 344,0 

6797,0 

-0,138 

trimestrais e anuais 

1955 

1310,4 

1433,8 

71 72,2 

0,262 

Economic Analysis, 

1956 

1 348,8 

1502,3 

7375,2 

-0,736 

Departamento de Comercio 

1957 

1381,8 

1539,5 

7315,3 

-0,261 

dos EUA (http://www.bea. 

1958 

1393,0 

1553,7 

7870,0 

-0,575 

doc.gov/bea/dn 1 .htm). 

1959 

1470,7 

1623,8 

8188,1 

2,296 

Rendimento nominal anual 

1960 

1510,8 

1664,8 

8351,8 

1,511 

dos Tftulos do Tesouro de 

1961 

1541,2 

1720,0 

8971,9 

1,296 

tres meses: Economic 

1962 

1617,3 

1803,5 

9091,5 

1,396 

Report of the President, 

900? 

1963 

1684,0 

1871,5 

9436,1 

2,058 

Riqueza nominal = valor 

1964 

1 784,8 

2006,9 

10003,4 

2,027 

lfquido nominal de 

1965 

1897,6 

2131,0 

10562,8 

2,112 

domicflios (pessoas fisicas) 

1966 

2006,1 

2244,6 

10522,0 

2,020 

e organizagoes sem fins 

1967 

2066,2 

2340,5 

11312,1 

1,213 

fluxo de firndos do Federal 

1968 

2184,2 

2448,2 

12145,4 

1,055 

Reserve (http://www. 

1969 

2264,8 

2524,3 

11672,3 

1,732 

federalreserve .go v). 

1970 

2314,5 

2630,0 

11650,0 

1,166 


1971 

2405,2 

2745,3 

12312,9 

-0,712 


1972 

2550,5 

2874,3 

1 3499,9 

-0,156 


1973 

2675,9 

3072,3 

13081,0 

1,414 


1974 

2653.7 

3051,9 

11868,8 

-1,043 


1975 

2710,9 

3108,5 

12634,4 

-3,534 


1976 

2868,9 

3243,5 

1 3456,8 

-0,657 


1977 

2992,1 

3360,7 

13786,3 

-1,190 


1978 

3124,7 

3527,5 

14450,5 

0,113 


1979 

3203,2 

3628,6 

15340,0 

1,704 


1980 

3193,0 

3658,0 

15965,0 

2,298 






( Continua ) 
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TABELA 7.12 

( Continuagao ) 

Ano 

1981 

C 

3236,0 

RD 

3741,1 

Riqueza nominal 

15965,0 

Taxa de juros 

4,704 


1982 

3275,5 

3791,7 

16312,5 

4,449 


1983 

3454,3 

3906,9 

16944,8 

4,691 


1984 

3640,6 

4207,6 

17526,7 

5,848 


1985 

3820,9 

4347,8 

19068,3 

4,331 


1986 

3981,2 

4486,6 

20530,0 

3,768 


1987 

4113,4 

4582,5 

21235,7 

2,819 


1988 

4279,5 

4784,1 

22332,0 

3,287 


1989 

4393,7 

4906,5 

23659,8 

4,318 


1990 

4474,5 

5014,2 

23105,1 

3,595 


1991 

4466,6 

5033,0 

24050,2 

1,803 


1992 

4594,5 

5189,3 

24418,2 

1,007 


1993 

4748,9 

5261,3 

25092,3 

0,625 


1994 

4928,1 

5397,2 

25218,6 

2,206 


1995 

5075,6 

5539,1 

27439,7 

3,333 


1996 

5237,5 

5677,7 

29448,2 

3,083 


1997 

5423,9 

5854,5 

32664,1 

3,120 


1998 

5683,7 

6168,6 

35587,0 

3,584 


1999 

5968,4 

6320,0 

39591,3 

3,245 


2000 

6257,8 

6539,2 

38167,7 

3,576 


Notas: Ano = calendario civil 

C = despesas reais de consumo, em bilhoes de dolares encadeados de 1996 
RD = renda pessoal disponfvel real, em bilhoes de dolares encadeados de 1996. 

Riqueza = riqueza real, em bilhoes de dolares encadeados de 1996 

Juros = rendimento nominal anual dos Titulos do Tesouro americano de tres meses - taxa de inflagao (medida pela variagao 
porcentual no fndice de pregos anual encadeado). 

A variavel riqueza nominal convertida em termos reais foi criada com dados da medigao feita pelo Federal Reserve Board do 
valor liquido nominal no fim do ano de domicilios (pessoas flsicas) e organizagdes sem fins lucrativos nas contas de fluxo dos 
fundos. O indice de pregos utilizado para converter esta variavel de riqueza nominal em real foi a media do indice de pregos 
encadeado do quarto trimestre do ano corrente e do primeiro trimestre do ano subsequente. 


7.25. Estimagao dos pregos da agao da Qualcomm. Como exemplo da regressao polinomial, 
considere os dados sobre os pregos semanais da agao da Qualcomm, Inc., uma empresa que 
projeta e produz equipamentos de telecomunicagao digital sem fio no periodo de 1995 a 
2000. Os dados completes podem ser encontrados na Tabela 7.13 no site do livro. Durante 
o final da decada de 1990, as agoes do setor de tecnologia foram particularmente lucrati- 
vas, mas que tipo de modelo de regressao deve se ajustar melhor a esses dados? A Figura 
7.4 mostra um grafico basico dos dados durante esse periodo. 

O grafico nao parece assemelhar-se a uma curva em S alongado; parece haver um ligei- 
ro aumento no prego medio da agao, mas depois a taxa aumenta drasticamente em diregao 
a extrema direita do grafico. A medida que a demanda por telefones especializados aumen- 
tou e o boom tecnologico ganhou forga, o prego das agoes acompanhou em um ritmo mui- 
to mais rapido. 

a. Estime um modelo linear para prever o prego de fechamento da agao baseado no tempo. 
Esse modelo parece ajustar-se bem aos dados? 

b. Agora, estime um modelo quadratico usando tanto o tempo como o quadrado do tempo. 
Esse modelo tem melhor ajustamento que o de (a)? 

c. Por fim, ajuste o seguinte polinomio ciibico ou de terceiro grau: 

Y, = A> + PiXt + p 2 xj + p 3 Xf + u, 

em que Y = pregos da agao eX— tempo. Qual modelo parece ser o melhor estimador para 
os pregos das agoes? 
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FIGURA 7.4 

Precos da a§ao ao 
longo do tempo. 


Preco 



Data 


Apendice 7 A 


7A.1 Deriva^ao dos estimadores de MQO dados nas 
Equates (7.4.3) a (7.4.5) 


Derivando a equajao 


= Hw - a - - to ) 2 


(7.4.2) 


parcialmente em relagao as tres incognitas e igualando a zero as tres equafoes resultantes, obtemos 

3 


9 / 3 i 

9 E 

3/02 

3E3? 

3ft 


= 2 ^](y, - ft - P2X2, - PiX2,)(- 1) = 0 

= 2 - fii - PlX 2 i - foXuX-Xji) = 0 

= I'YjJt - fa - $ 2 X 2 , - foX 3i )(-X 3i ) = 0 


Simplificando, obtemos as Equasdes (7.4.3) a (7.4.5). 
Note que as tres equates podem ser escritas como 


= 0 

7>X 2 , = 0 (Porque?) 

J2“.X 2 , = 0 


que mostram as propriedades do ajustamento de minimos quadrados; especificamente, que a soma dos residuos 
e igual a zero e que eles nao estao correlacionados com as variaveis X 2 e X 3 . 
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Casualmente, note que, para obtermos os estimadores de MQO do modelo de regressao linear com k varia- 
veis (7.4.20), procedemos de modo analogo. Assim, comegamos com 

E“? = J2 (Y ‘ - A - fo x 2i — PM 2 

Calculando as derivadas parciais em relagao a cada uma das k incognitas, igualando as equagoes resultantes a 
zero e reorganizando os termos, obtemos as seguintes k equagoes normais para as k incognitas: 

E Y, = nfo + P 2 X 2i + + ••'+ Pk E Xki 

E Y ‘ X 2‘ = fa E X2i + ft J2 X 21 + ft E XliXx + ■ ■ ■ + PkJ2 X 2i X ki 

E Y ‘ X * = h E X3 '- + A E X * X * + h E X l + • • • + h E X 3i X ki 

E Y ‘ Xk - = 4i E + k E + & E + • • • + aE4 

Ou, passando para letras minusculas, essas equagdes podem ser expressas como 

E- V ‘ X2 ' = Pi E4 +aE *2;*3; + •■•+ At E ■^2i 

E**» = Pl^XliX-ii + ih E x 3i + ■ ■ • + Pk Y, *3 'Xki 

Yvix kl = PiYj xiiXki + & E X3,Xfc + ■" + Pk/. x li 

Cabe ainda notar que o modelo com k variaveis tambem satisfaz estas equagoes: 

ut = 0 

^ ' M i X 2 j — ^ ' M j j — ••• — ^ U 1 — 0 

7A.2 Igualdade dos coeficientes de PNBpc em (7.3.5) 
e (7.6.2) 

Seja Y = MI, X 2 = PNBpc eX 3 = TAF e usando a forma do desvio, temos 

yi=b l3 x 3i +u u (1) 

X 2 i = 623*3; + M2; ( 2 ) 

Fazendo a regressao de i3j contra u 2 obtemos: 

a\ = = - 0,0056 (para nosso exemplo) (3) 

“2 i 

Note que, como os u sao resfduos, suas medias sao zero. Usando (1) e (2), podemos escrever (3) como 

E(Fi - 6l3*3;)(*2; “ 6 2 3*3<) 


a l = 


ZX* 2 ; - 62 3*3; ) 2 


(4) 
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Expandindo a expressao e observando que 

bi3 


J2 x 2i x 3i 

£4 


e 


b 13 - 


£yiS3.- 

£4 


Fazendo as substituigoes em (4), obtemos 


_ (T,yi x 2i) (£4) - (£ yi x n ) (£*2,*3i) 

(£ 4 ) (£ 4 )- (£m) 2 

= - 0,0056 (para nosso exemplo) 


(5) 

( 6 ) 


(7.4.7) 


7A.3 Deriva^ao da Equa^ao (7.4.19) 


Lembre-se de que: 

Ui = Yj - Pi - P2X2i ~ PiX^ 

que tambem pode ser escrito como 

Ui = Vi - p 2 x 2 i ~ (83x3; 

em que as letras minusculas, como sempre, indicam desvios em relagao aos valores medios. Agora, 

X = X^ 1 '"') 

= X Ui(yi ~ $2 X 2i ~ P 3 X 3 ;) 

= 

em que se faz uso do fato de que ^ «,\X 2 i = £ m,X 3 , = 0. (Por que?) Tambem: 

= X^‘“> = ~ h x 2i ~ Pl x 2i) 


isto e, 


X“? = X^ 2 “ En* ~ ^ X**' (7.4.19) 

que e o resultado desejado. 


7A.4 Estima^ao de maxima verossimilhan^a do 
modelo de regressao multipla 


Estendendo as ideias apresentadas no Apendice 4A do Capftulo 4, podemos escrever a fungao de verossimilhanga 
logaritmica do modelo de regressao Unear com k variaveis (7.4.20) como 


InZ = - 



, h* 2 i - PkX ki ) 2 

ln(27r) - 2 £-4- 


Calculando as derivadas parciais dessa fungao em relagao a Pi, ■ • ■ , Pk e cr, obtemos as seguintes (K + 1) 
equagoes: 


3 InZ, 


X X^ - Pi ~ foX 2i - PkXkiX- 1) 


0 ) 
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a In L 


9 Ini 
dpk 
9 Ini 
da 2 


^2 - A - hX 2i - p k X ki )(-X 2i ) 

■ -i V(7i fa p 2 X 2i - PkX ki ){-X ki ) 

(J l L — 4 

- PiX 2 t - PkXuf 


( 2 ) 

m 

(K+ 1) 


Igualando essas equa?oes a zero (condi?ao de primeira ordem para a otimiza?ao) e denotando os estimado- 
res de MV como fa, fa, ..., fa e a 1 , obtemos, depois de algumas manipulates algebricas simples: 


y, Yi - nfa + fa y X 2i + ■ • • + fa y X k i 

y YiX 2 i = fa y x 2 , + / 3 2 yy, + ■••+ p k y x 2 i x K 
y y,x u = fa y + p 2 y ** *« + ■ ■ • + ^yy 

que sao exatamente as equates normals da teoria dos mihimos quadrados, como mostra a Sejao 7A.1 do Apendice 
7A. Portanto, os estimadores de maxima verossimilhanga, os p sao semelhantes aos estimadores de MQO, os p, apresen- 
tados anteriomiente. Mas, como observado no Apendice 4A do Capi'tulo 4, essa igualdade nao e acidental. 

Substituindo os estimadores de MV (= MQO) na equa?ao (K + 1), obtemos, apos simplificar o estimador de MV 
para a 2 , que e: 

d 2 = - YjJi -Pi- P2X2, - faXkif 

n t— 4 



Como observado, esse estimador difere do estimador de MQO d 2 = « 2 /(” _ X). E como este ultimo e um 

estimador nao viesado de cr, tal conclusao implica que o estimador de MV, cr, e um estimador viesado. Mas, como 
pode ser prontamente verificado, assintoticamente a 1 tambem e nao viesado (ou nao tendencioso). 


7A.5 Tela do resultado do EViews para a fun^ao de 
produ^ao Cobb-Douglas (7.9.4) 


Dependent Variable: YI 
Method: Least Squares 
Included observations: 51 



Coefficient 

Std. Error 

t-Statistic 

Prob. 

c 

3.887600 

0.396228 

9.811514 

0.0000 

Y2 

0.468332 

0.098926 

4.734170 

0.0000 

Y3 

0.521279 

0.096887 

5.380274 

0.0000 

R-squared 

0.964175 

Mean dependent var. 

16.94139 


Adjusted R-squared 

0.962683 

S.D. dependent var. 

1.380870 


S.E. of regression 

0.266752 

Akaike info criterion 

0.252028 


Sum squared resid. 

3.415520 

Schwarz criterion 

0.365665 


Log likelihood 

-3.426721 

Hannan-Quinn criterion 

0.295452 


F-statistic 

645.9311 

Durbin-Watson stat. 

1.946387 


Prob. (f-statistic) 

0.000000 






Covariance of Estimates 




C 

Y2 

Y3 


C 

0.156997 

0.010364 

-0.020014 


Y2 

0.010364 

0.009786 

-0.009205 


Y3 

-0.020014 

-0.009205 

0.009387 
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Y 

X2 

X3 

Y1 

Y2 

Y3 

Y1HAT 

Y1RESID 

38,372,840 

424,471 

2,689,076 

17.4629 

12.9586 

14.8047 

1 7.6739 

-0.2110 

1,805,427 

19,895 

57,997 

14.4063 

9.8982 

10.9681 

14.2407 

0.1656 

23,736,129 

206,893 

2,308,272 

16.9825 

12.2400 

14.6520 

17.2577 

-0.2752 

26,981,983 

304,055 

1,376,235 

17.1107 

12.6250 

14.1349 

17.1685 

-0.0578 

217,546,032 

1,809,756 

13,554,116 

19.1979 

14.4087 

16.4222 

19.1962 

0.0017 

19,462,751 

180,366 

1,790,751 

16.7840 

12.1027 

14.3981 

17.0612 

-0.2771 

28,972,772 

224,267 

1,210,229 

17.1819 

12.3206 

14.0063 

16.9589 

0.2229 

14,313,157 

54,455 

421,064 

16.4767 

10.9051 

12.9505 

15.7457 

0.7310 

159,921 

2,029 

7,188 

11.9824 

7.6153 

8.8802 

12.0831 

-0.1007 

47,289,846 

471,211 

2,761,281 

17.6718 

13.0631 

14.8312 

17.7366 

-0.0648 

63,015,125 

659,379 

3,540,475 

17.9589 

13.3991 

15.0798 

18.0236 

-0.0647 

1,809,052 

17,528 

146,371 

14.4083 

9.7716 

11.8939 

14.6640 

-0.2557 

10,511,786 

75,414 

848,220 

16.1680 

11.2307 

13.6509 

16.2632 

-0.0952 

105,324,866 

963,156 

5,870,409 

18.4726 

13.7780 

15.5854 

18.4646 

0.0079 

90,120,459 

835,083 

5,832,503 

18.3167 

13.6353 

15.5790 

18.3944 

-0.0778 

39,079,550 

336,159 

1,795,976 

17.4811 

12.7253 

14.4011 

17.3543 

0.1269 

22,826,760 

246,144 

1,595,118 

16.9434 

12.4137 

14.2825 

17.1465 

-0.2030 

38,686,340 

384,484 

2,503,693 

17.4710 

12.8597 

14.7333 

17.5903 

-0.1193 

69,910,555 

216,149 

4,726,625 

18.0627 

12.2837 

15.3687 

17.6519 

0.4109 

7,856,947 

82,021 

415,131 

15.8769 

11.3147 

12.9363 

15.9301 

-0.0532 

21,352,966 

1 74,855 

1,729,116 

16.8767 

12.0717 

14.3631 

17.0284 

-0.1517 

46,044,292 

355,701 

2,706,065 

17.6451 

12.7818 

14.8110 

1 7.5944 

0.0507 

92,335,528 

943,298 

5,294,356 

18.3409 

13.7571 

15.4822 

18.4010 

-0.0601 

48,304,274 

456,553 

2,833,525 

17.6930 

13.0315 

14.8570 

17.7353 

-0.0423 

17,207,903 

267,806 

1,212,281 

16.6609 

12.4980 

14.0080 

1 7.0429 

-0.3820 

47,340,157 

439,427 

2,404,122 

17.6729 

12.9932 

14.6927 

17.6317 

0.0411 

2,644,567 

24,167 

334,008 

14.7880 

10.0927 

12.7189 

15.2445 

-0.4564 

14,650,080 

163,637 

627,806 

16.5000 

12.0054 

1 3.3500 

16.4692 

0.0308 

7,290,360 

59,737 

522,335 

15.8021 

10.9977 

13.1661 

15.9014 

-0.0993 

9,188,322 

96,106 

507,488 

16.0334 

11.4732 

13.1372 

16.1090 

-0.0756 

51,298,516 

407,076 

3,295,056 

17.7532 

12.9168 

15.0079 

17.7603 

-0.0071 

20,401,410 

43,079 

404,749 

16.8311 

10.6708 

12.9110 

15.6153 

1.2158 

87,756,129 

727,177 

4,260,353 

18.2901 

13.4969 

15.2649 

18.1659 

0.1242 

101,268,432 

820,01 3 

4,086,558 

18.4333 

13.6171 

15.2232 

18.2005 

0.2328 

3,556,025 

34,723 

184,700 

15.0842 

10.4552 

12.1265 

15.1054 

-0.0212 

124,986,166 

1,174,540 

6,301,421 

18.6437 

13.9764 

15.6563 

18.5945 

0.0492 

20,451,196 

201,284 

1,327,353 

16.8336 

12.2125 

14.0987 

16.9564 

-0.1229 

34,808,109 

257,820 

1,456,683 

17.3654 

12.4600 

14.1917 

17.1208 

0.2445 

104,858,322 

944,998 

5,896,392 

18.4681 

13.7589 

15.5899 

18.4580 

0.0101 

6,541,356 

68,987 

297,618 

15.6937 

11.1417 

12.6036 

15.6756 

0.0181 

37,668,126 

400,317 

2,500,071 

1 7.4443 

12.9000 

14.7318 

17.6085 

-0.1642 

4,988,905 

56,524 

311,251 

15.4227 

10.9424 

12.6484 

15.6056 

-0.1829 

62,828,100 

582,241 

4,126,465 

17.9559 

13.2746 

15.2329 

18.0451 

-0.0892 

172,960,157 

1,120,382 

11,588,283 

18.9686 

13.9292 

16.2655 

18.8899 

0.0786 

15,702,637 

150,030 

762,671 

16.5693 

11.9186 

13.5446 

16.5300 

0.0394 

5,418,786 

48,134 

276,293 

15.5054 

10.7817 

12.5292 

15.4683 

0.0371 

49,166,991 

425,346 

2,731,669 

17.7107 

12.9607 

14.8204 

17.6831 

0.0277 

46,164,427 

313,279 

1,945,860 

17.6477 

12.6548 

14.4812 

17.3630 

0.2847 

9,185,967 

89,639 

685,587 

16.0332 

11.4035 

13.4380 

16.2332 

-0.2000 

66,964,978 

694,628 

3,902,823 

18.0197 

13.4511 

15.1772 

18.0988 

-0.0791 

2,979,475 

15,221 

361,536 

14.9073 

9.6304 

12.7981 

15.0692 

-0.1620 


Nota: Y1 = In Y;Y2 = In X2; Y3 = In X3 

Os autovalores sao 3,7861 e 187,5269, que serao usados no Capitulo 10. 



Capitulo 

Analise da regressao 
multipla: o problema da 
inferencia 



Este capitulo desenvolve as ideias de estimagao de intervalos e teste de hipoteses tratadas no Ca¬ 
pitulo 5 para os modelos que envolvem tres ou mais variaveis. Embora, sob muitos aspectos, os 
conceitos desenvolvidos no Capitulo 5 possam ser aplicados diretamente ao modelo de regressao 
multipla, algumas caracterfsticas adicionais sao exclusivas a tais modelos, e sao elas que receberao mais 
atengao neste capitulo. 


8.1 Novamente a hipotese da normalidade 

Ja sabemos ate aqui que, se o nosso unico objetivo e a estimagao pontual dos parametros dos 
modelos de regressao, o metodo dos minimos quadrados ordinarios (MQO), que nao faz nenhuma 
suposigao sobre a distribuigao da probabilidade dos termos de erro m„ sera suficiente. Mas, se a meta 
e a estimagao e a inferencia, como discutido nos Capftulos 4 e 5, precisaremos supor que os m, seguem 
alguma distribuigao de probabilidade. 

Pelos motivos ja claramente explicados, pressupomos que os u ,■ seguem a distribuigao normal 
com media zero e variancia constante cr. Manteremos essa hipotese nos modelos de regressao multi¬ 
pla. Com a hipotese da normalidade, e seguindo a discussao dos Capftulos 4 e 7, descobrimos que os 
estimadores de MQO dos coeficientes parciais de regressao, identicos aos estimadores de maxima 
verossimilhan 9 a (MV), sao os melhores estimadores lineares nao viesados (ou nao tendenciosos) — 
MELNT ou, do ingles, BLUE 1 . Os estimadores /U, ft e ft estao distribufdos normalmente com me- 
dias iguais aos verdadeiros ft, ft e ft e as variancias apresentadas no Capitulo 7. Alem disso, (n — 3) 
a 2 /cr 2 segue a distribu^ao x 2 com n — 3 graus de liberdade e os tres estimadores de MQO sao distri¬ 
bufdos independentemente de a 1 . A demonstragao acompanha o caso de duas variaveis discutido no 
Apendice 3A, Segao 3A. Como resultado, de acordo com o Capitulo 5, podemos mostrar que, ao 
substituirmos a 2 por seu estimador a 2 nao viesado no calculo dos erros padrao, cada uma das varia¬ 
veis a seguir segue a distribuigao 1 com n — 3 graus de liberdade 


1 Sob a hipotese de normalidade, os estimadores de MQO, p 2 , ft e p 1 sao os estimadores com variancia minima 
dentro de toda a classe de estimadores nao viesados (ou nao tendenciosos), sejam lineares ou nao. Em sintese, 
eles sao os melhores estimadores nao viesados (ou nao tendenciosos) — MELNT ou, do ingles, BLUE. Veja RAO, 
C. R. Linear statistical inference and its applications. Nova York: John Wiley & Sons, 1965. p. 258. 
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ft - ft 
ep(ft) 

Pi ~ Pi 
ep(ft) 
ft “ ft 
ep(ft) 


( 8 . 1 . 1 ) 

( 8 . 1 . 2 ) 

(8.1.3) 


Observe que os graus de liberdade agora sao n — 3, porque, ao calcularmos ffu} e, portanto, rr * 1 2 , 
precisamos estimar primeiro os tres coeficientes parciais de regressao, o que, portanto, coloca tres 
restri§oes a soma do quadrado dos resfduos (SQR) (segundo essa logica, no caso de quatro variaveis 
devera ser n — 4 graus de liberdade e assim por diante). Alem disso, a distribuiijao t pode ser empre- 
gada para estabelecer intervalos de confi an 9 a, bem como testar hipoteses estatisticas sobre os verda- 
deiros coeficientes parciais de regressao da populapao. Do mesmo modo, a distribuipao do y 2 pode 
ser usada para testar hipoteses relativas ao verdadeiro a 2 . Para demonstrarmos a mecanica efetiva, 
utilizamos o exemplo a seguir. 


EXEMPLO 8.1 

Retomando o 
exemplo da 
mortalidade 


No Capftulo 7, fizemos a regressao da mortalidade infantil (Ml) contra o PNB per capita 
(PNBpc) e a taxa de alfabetiza^ao feminina (TAF) para uma amostra de 64 pafses. Os resulta- 
dos da regressao dada na Equagao (7.6.2) sao reproduzidas abaixo com informa^oes adicio- 
nais: 


( 8 . 1 . 4 ) 


infantil 

M|, = 263,6416 

- 0,0056 PNBpc, 

- 2,2316 TAF, 


ep= (11,5932) 

(0,0019) 

(0,2099) 


t= (22,7411) 

(- 2,8187) 

(-10,6293) 


valor p = (0,0000)* 

(0,0065) 

(0,0000)* 


R 2 = 0,7077 R 2 = 0,6981 


em que * indica um valor extremamente baixo. 

Na Equa^ao (8.1.4), seguimos o primeiro formato apresentado na Equagao (5.11.1), em 
que as cifras do primeiro conjunto de parenteses sao os erros padrao estimados, os do segundo 
conjunto sao os valores f relativos a hipotese nula de que o coeficiente populacional relevante 
tern valor zero e os do terceiro sao os valores p estimados. Os valores de R 2 e R 2 ajustados, tam- 
bem sao dados. Ja interpretamos essa regressao no Exemplo 7.1. 

E quanto a significancia estatfstica dos resultados observados? Considere, por exem¬ 
plo, o coeficiente de PNBpc, —0,0056. Esse coeficiente e estatisticamente significativo, ou 
seja, estatisticamente diferente de zero? Da mesma forma, o coeficiente de TAF, -2,231 6, 
e estatisticamente significativo? Ambos os coeficientes sao estatisticamente significativos? 
Para responder a essas e outras questoes relacionadas, consideremos primeiro os tipos de 
testes de hipoteses que podemos encontrar no contexto de um modelo de regressao 
multipla. 


8.2 Teste de hipoteses na regressao multipla: comentarios gerais 

Uma vez que fomos alem do basico do modelo de regressao linear de duas variaveis, os testes de 
hipoteses assumem varias formas interessantes: 

1. Testar as hipoteses relativas a um coeficiente individual parcial de regressao (Sec^ao 8.3) 

2. Testar a significancia geral do modelo de regressao midtipla estimado, ou seja, descobrir se 
todos os coeficientes angulares parciais sao simultaneamente iguais a zero (Se 5 ao 8.4) 
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Parte Um 


Modelos de regressao com equaqao unica 


3. Testar se dois ou mais coeficientes sao iguais entre si (Segao 8.5). 

4. Testar se os coeficientes parciais de regressao satisfazem certas restrigoes (Segao 8.6) 

5. Testar a estabilidade do modelo de regressao estimado ao longo do tempo ou em diferentes 
unidades de corte transversal (Segao 8.7). 

6. Testar a forma funcional dos modelos de regressao (Segao 8.8). 

Pelo fato de os testes de um ou mais desses tipos ocorrerem normalmente na analise pratica, de- 
dicaremos uma segao a cada tipo. 


8.3 Testes de hipotese relativos aos coeficientes individuals de 
regressao 

Se aceitarmos a hipotese de que u, ~ N( 0, a 2 ) segue distribuigao nornal com media zero e varian- 
cia constante, entao, como observado na Segao 8.1, poderemos usar o teste 1 para verificar uma hipo¬ 
tese sobre qualquer dos coeficientes parciais individuals da regressao. Considere a regressao da 
mortalidade infantil, Equagao (8.1.4), para ilustrar a mecanica. Podemos postular que: 

H 0 :p 2 =0 e 


A hipotese nida afirma que, quando X 2 (taxa de alfabetizagao feminina) e mantido constante, X 2 
(PNBpc) nao exerce influencia (linear) sobre Y (mortalidade infantil) 2 . Para testarmos a hipotese 
nula, usamos o teste t dado na Equagao (8.1.2). De acordo com o Capftulo 5 (veja a Tabela 5.1), se o 
valor de t calculado exceder o valor crftico de t no nrvel de significancia escolhido, poderemos rejei- 
tar a hipotese nula; sob outras circunstancias, nao poderemos rejeita-la. Em nosso exemplo ilustrati- 
vo, usando (8.1.2) e observando que fi 2 — 0 sob a hipotese nula, obtemos: 


-0,0056 

0,0020 


2,8187 


(8.3.1) 


conforme mostra a Equagao (8.1.4). 

Note que temos 64 observagoes. Nesse exemplo, sao 61 graus de liberdade (Por que?). Se 
consultarmos a Tabela t do Apendice D, nao encontraremos dados correspondentes a 61 gl. O 
mais proximo sao 60 gl. Se usarmos esses graus de liberdade, e assumirmos um a, o nrvel de 
significancia (ou seja, a probabilidade de cometer um erro do tipo I) de 5%, o valor t crftico sera 
de 2,0 para um teste bicaudal (procure t a , 2 para 60 gl) ou 1,671 para um teste unicaudal (procure 
t a para 60 gl). 

Em nosso exemplo, a hipotese alternativa e bilateral. Usamos o valor t bilateral. Uma vez 
que o valor 1 calculado, 2,8187 (em termos absolutos), excede o valor t crftico, 2, podemos re- 
jeitar a hipotese nula de que o PNBpc nao afeta a mortalidade infantil. Em outras palavras, 
mantida constante a alfabetizagao feminina, o PNB per capita (PNBpc) tem um efeito (negati- 
vo) significativo na mortalidade infantil e, como seria de esperar, a priori. Graficamente, a si- 
tuagao e a da Figura 8.1. 

Na pratica, nao e preciso pressupor qualquer valor especifico de a para conduzir o teste de hipo- 
teses. Podemos simplesmente usar o valor p da Equagao (8.1.4) que, neste caso, e 0,0065. A interpre- 
tagao desse valor p (o nivel exato de significancia) e a de que, se a hipotese nula fosse verdadeira, a 
probabilidade de obter um valor t igual a 2,8187 ou maior (em termos absolutos) seria de apenas 


2 Na maioria das pesquisas empfricas, utiliza-se esta forma para a hipotese nula, ou seja, adota-se a posigao extre¬ 
ma de que nao ha qualquer relagao entre a variavel dependente e a variavel explanatory em consideragao. A 
ideia aqui e verificar, de infcio, se a relagao entre as duas e trivial. 
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0,0065 ou 0,65%, que e, de fato, uma probabilidade pequena, muito menor que o valor adotado arti- 
ficialmente de a — 5%. 

Esse exemplo oferece uma oportunidade de decidir se queremos usar um teste t uni ou bicaudal. 
Como, a priori, esperamos que a relagao entre a mortalidade infantil e o PNB per capita seja negati- 
va (por que?), deveriamos usar o teste unicaudal. A hipotese nula e a altemativa deveriam ser: 

fa >0 e H\‘/3 2 < 0 

Como o leitor ja sabe, podemos rejeitar a hipotese nula com base no teste t unicaudal. Se puder- 
mos rejeitar a hipotese nula em um teste bilateral, teremos evidencias suficientes para rejeita-la no 
cenario unilateral enquanto a estatfstica estiver na mesma diregao que o teste. 

No Capftulo 5, vimos a estreita conexao entre o teste de hipoteses e a estimagao de intervalos de 
confian 9 a. Em nosso exemplo, o intervalo de con ban 9 a de 95% para fa e: 

fa ~ 4/2 ep(ft) ^ fa ^ fa + 4/2 ep(ft) 


que em nosso exemplo, resulta em: 

-0,0056- 2(0,0020) < fa < - 0,0056+ 2(0,0020) 


isto e, 


-0,0096 < fa < - 0,0016 (8.B.2) 

ou seja, o intervalo, —0,0096, a —0,0016, inclui o verdadeiro coeficiente fa com um nivel de confianpa 
de 95%. Assim, se 100 amostras de tamanho 64 forem selecionadas e 100 intervalos de con- 
fiani/a como na Equac^ao (8.3.2) forem formulados, esperamos que 95 deles incluam o verdadeiro 
parametro populacional fa. Devido ao intervalo (8.3.2) nao incluir o valor proposto como hipo¬ 
tese nula (zero), podemos rejeitar a hipotese nula (zero) de que o verdadeiro fa seja zero com 
95% de confianfa. 

Assim, se usarmos o teste t de significance como em (8.3.1) ou a estimapao de intervalos de 
confianpa, como em (8.3.2), chegamos a mesma conclusao. No entanto, isso nao deveria ser 
surpreendente em vista da estreita relapao entre estimapao de intervalos de confianpa e teste de 
hipoteses. 

De acordo com o processo que acabamos de descrever, podemos testar hipoteses relativas aos 
outros parametros da regressao do nosso exemplo. Os dados necessarios ja foram fornecidos na 
Equa 5 ao (8.1.4). Por exemplo, imagine que desejamos testar a hipotese de que, mantida constante a 
influencia do PNBpc, a taxa de alfabetizagao feminina nao tem nenhum efeito sobre a mortalidade 


FIGURA 8.1 

Intervalo de confianga 
de 95% para t (60 gl). 


m 
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infantil. Podemos rejeitar tal hipotese, pois, sob a hipotese nula, o valor p da obtengao de um valor t 
absoluto igual ou maior que 10,6 e praticamente zero. 

Antes de avatar, lembre-se de que o procedimento do teste t baseia-se na hipotese de que o termo 
de erro, m„ segue a distribuigao normal. Embora nao possamos observar diretamente podemos 
observar sua proxy, u„ ou seja, os resfduos. No caso da mortalidade infantil, o histograma dos resf- 
duos e apresentado na Figura 8.2. 

Segundo o histograma, parece que os resfduos sao normalmente distribufdos. Podemos tambem 
calcular o teste Jarque-Bera (JB) de normalidade, como mostrado na Equagao (5.12.1). No nosso 
caso, o valor JB e 0,5594 com um valor p de 0,76 3 . Parece que o termo de erro do exemplo segue a 
distribuigao normal. Naturalmente, lembre-se de que o teste JB e para grandes amostras e que nossa 
amostra, com 64 observagSes, pode nao ser suficientemente grande. 


8.4 


Teste da significancia geral da regressao amostral 


Na segao anterior, estavamos preocupados em testar a significancia dos coeficientes parciais indi¬ 
viduals da regressao estimada, ou seja, sob a hipotese separada de que cada coeficiente parcial de 
regressao populacional verdadeiro era igual a zero. Mas, considere agora a seguinte hipotese: 

H 0 :p 2 =P3=0 (8.4.1) 

Essa hipotese nula propoe que f J > 2 e ft 2 sejam, conjunta ou simultaneamente, iguais a zero. Para 
testa-la, recorremos ao que chamamos de teste da significancia geral da linha de regressao observa- 
da ou estimada, ou seja, se Y e relacionado linearmente a tanto X 2 quanto X 3 . 

A hipotese conjunta proposta na Equagao (8.4.1) pode ser testada verificando as significances 
individuals de f> 2 e /ft, como fizemos na Segao 8.3? Aresposta e nao, e a razao e a seguinte: na Segao 
8.3, ao testarmos a significancia individual de um coeficiente parcial de regressao observado, supuse- 
mos implicitamente que cada teste de significancia fosse baseado em uma amostra diferente (ou seja, 
independente). Ao testarmos a significancia de /ft sob a hipotese de que /ft = 0, presumimos tacita- 
mente que o teste era baseado em uma amostra diferente da utilizada para testar a significancia de /ft 
sob a hipotese nula de que /ft — 0. Mas, para testarmos a hipotese conjunta da Equagao (8.4.1), se 
usassemos dados da mesma amostra, estarfamos violando a hipotese basica do procedimento de teste 4 . 
A questao pode ser colocada de forma diferente: na Equayao (8.3.2), estabelecemos um intervalo 


FIGURA 8.2 

Histograma de 
resfduos da regressao. 



Series: resfduos 


Amostra 1 64 


Observances 64 


Media 

-4,95 x 1CT 14 

Mediana 

0,709227 

Maximo 

96,80276 

Mmimo 

-84,26686 

Desvio Padrao 

41,07980 

Assimetria 

0,227575 

Curtose 

2,948855 

Jarque-Bera 

0,559405 

Probabilidade 

0,756009 


3 No nosso exemplo, o valor da assimetria e de 0,2276 e o da curtose, 2,9488. Recorde-se de que, no caso de uma 
variavel com distribui£ao normal, os valores da assimetria e da curtose sao de 0 e 3, respectivamente. 

4 Em qualquer amostra dada, a cov (j} 2 , ft) pode nao ser zero, isto e, ft e ft podem estar correlacionados. Veja a 
Equagao (7.4.1 7). 
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de confianpa de 95% para ft. Mas, se usarmos os mesmos dados para estabelecer um intervalo de 
confianpa para ft, com um coeficiente de confianpa de 95%, nao poderemos ter certeza de que ft e ft 
estao nos seus respectivos intervalos de confianpa com uma probabilidade de (1 — a)( 1 — a) — (0,95) 
(0,95). 

Em outras palavras, apesar das afirmapoes 

Pr [ft - ft/2 ep(ft) < ft < ft + ft/2 ep(ft)] = 1 - a 
Pr [ft - ft/2 ep(ft) < ft < ft + ft/2 ep(ft)] = 1 - a 

serem individualmente verdadeiras, nao e verdade que a probabilidade de que os intervalos 

[ft ± ft /2 ep(ft), ft ± ft /2 ep(ft)] 


incluam simultaneamente ft e ft seja (1 — a) 2 , porque os intervalos podem nao ser independentes 
quando usamos os mesmos dados para obte-los. Dito de forma diferente, 

[...] testar uma serie de hipoteses singulares (individuals) nao e equivalente a testar essas mesmas hi¬ 
poteses em conjunto. A razao intuitiva para isso e que, em um teste conjunto de varias hipoteses, qual- 
queruma delas e “afetada” pela informapao relativa as outras hipoteses. 5 

A conclusao do argumento anterior e que, para um exemplo dado (amostra), apenas um intervalo 
de confianpa ou um teste de significancia pode ser obtido. Como podemos, entao, testar a hipotese 
nula simultanea ft = ft = 0? A resposta esta a seguir. 


A abordagem da analise de variancia para teste de significancia geral 
de uma regressao multipla observada: o teste F 

Como ja foi explicado, nao podemos empregar o conhecido teste t para verificar a hipotese con- 
junta de que os verdadeiros coeficientes parciais angulares sao simultaneamente iguais a zero. No 
entanto, essa hipotese conjunta pode ser verificada pela tecnica da analise de variancia (ANOVA), 
apresentada na Sepao 5.9, que pode ser demonstrada como se segue. 

Recordemos a identidade 

t: yf= ft y^,y, x i, + ft y,xii + (8.4.2) 

STQ = SQE + SQR 

STQ, a soma total dos quadrados, tem, como de costume, n — 1 graus de liberdade e SQE, soma dos 
quadrados explicados, tem n — 3 porrazoes ja discutidas. SQR, a soma do quadrado dos resfduos, tem 
2 graus de liberdade uma vez que e uma funpao de ft e ft. Seguindo os procedimentos da ANOVA 
discutidos na Sepao 5.9, podemos montar a Tabela 8.1. 

Agora podemos demonstrar 6 * que, sob a hipotese de normalidade para it, e a hipotese nula ft = 
ft = 0, a variavel 


(ft T,yt x 2i + ft Y.yi^i)/ 2 _ SQE/gi 

E £?/(«" 3) “ SQR/gl ( 8 - 4 - 3 > 


5 FOMBY, Thomas B; HILL, R. Carter; JOHNSON, Stanley R. Advanced econometric methods. Nova York: Springer-Verlag, 
1984. p.37. 

6 Veja BROWNLEE, K. A. Statistical theory and methodology in science and engineering. Nova York: John Wiley & 

Sons, 1960. p. 278-280. 
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TABELA 8.1 

Tabela ANOVA para 
regressao com tres 
variaveis 


Fonte de variagao 


SQ gl 


Devido a regressao (SQE) fa E Yi x 2 i + fa E Yi x a 2 


Devido aos residuais (SQR) E uf 
Total E Vl 


n- 3 


n- 1 


MSQ 

fa E yi x 2i + fc E k/^3/ 

2 



esta distribm'da como a distribuigao F, com 2 e n — 3 graus de liberdade. 

Como podemos utilizar a razao F anterior? Podemos provar 7 que, sob a hipotese de que os 
Uj ~ MO, ct 2 ) seguem distribuigao normal com media zero e variancia constante, 

F&- = F(ct 2 ) = rr 2 (8.4.4) 

n— 3 

Com a hipotese adicional de que P 2 — h — 0, podemos demonstrar que: 

E(fa + fa Et< x 3,) 2 (8.4.5) 

- = CT 

2 

Portanto, se a hipotese nula for verdadeira, ambas as Equagoes (8.4.4) e (8.4.5) darao estimativas 
identicas do verdadeiro ct 2 . Essa afirmagao nao deveria surpreender, porque, se ha uma relagao trivial 
entre feX 2 e a unica fonte de variagao de Y deve-se a forgas aleatorias representadas por m,. Se, 
contudo, a hipotese nula for falsa, ou seja, se X 2 e A 3 influenciam definitivamente Y, a igualdade entre 
as Equagoes (8.4.4) e (8.4.5) nao se sustentara. Nesse caso, a SQE sera relativamente maior do que a 
SQR, levando em conta os respectivos graus de liberdade. Portanto, o valor F da Equagao (8.4.3) 
fornece um teste para a hipotese nula de que os verdadeiros coeficientes angulares sao simultanea- 
mente iguais a zero. Se o valor F calculado de acordo com a Equagao (8.5.3) superar o valor F crftico 
da Tabela de F ao nivel de significancia, rejeitamos // (l ; caso contrario, nao a rejeitamos. Como alter- 
nativa, se o valor p do F observado for suficientemente baixo, podemos rejeitar H 0 . 

A Tabela 8.2 resume o teste F. Voltando ao nosso exemplo ilustrativo, podemos obter a tabela 
ANOVA, como mostra a Tabela 8.3. 


TABELA 8.2 

Hipotese nula 

Hipotese alternativa 

Regiao critica 

Re sumo da 

Ho 

Hi 

Rejeitar Hose 

estatfstica F 



S 1 F 


ff 1 - a 2 

CTf > CT| 

_ 2 > ' ct,ng\,dg\ 

2 


CT 2 = CT 2 

CT 2 / ff 2 

5 I 2 

~2 > ^a/2,ng\,dg\ 


2 


OU < F(l- a /2),ngUgl 

Notas: 

1. Oj e <*2 s ^° as duas variancias populacionais. 

2. S j e 5 2 sao as duas variancias amostrais. 

3. ngl e Jgl denotam, respectivamente, os graus de liberdade do numerador e do denominador. 

4. Ao calcular a razao F, coloque o S 2 de valor mais elevado no numerador. 

5. Os valores criticos de F aparecem na ultima coluna. O primeiro subscrito de F refere-se ao nivel de significancia e o segundo aos graus de 
liberdade do numerador e do denominador. 

6. Note que F (1 - a /2),ngidg\ = l/F«/ 2 , dgi «gi- 


7 Ibid. 
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TABELA 8.3 

Tabela ANOVA para 
o exemplo de 
mortalidade infantil 


Regra. 


Fonte de variagao 

SQ 

gi 

MSQ 

Devido a regressao 

257.362,4 

2 

128.681,2 

Devido aos residuais 

106.315,6 

61 

1742,88 

Total 

363.678 

63 



Recorrendo a Equagao (8.4.3), obtemos: 


128.681,2 

1742,88 


73,8325 


(8.4.6) 


O valor de p da obtengao de um valor F igual a 73,8325 ou mais e quase zero, levando a rejeigao 
da hipotese de que PNBpc e TAF, em conjunto, nao exercem efeito sob a mortalidade infantil. Se 
fossemos usar o valor convencional do nlvel de significancia de 5%, o valor critico de F, com 2 graus 
de liberdade no numerador e 60 no denominador (os graus de liberdade efetivos sao 61), e de quase 
3,15 ou cerca de 4,98 se usarmos o nivel de significancia de 1%. Evidentemente, o F observado 
de cerca de 74 e muito superior a qualquer um desses valores crfticos de F. Podemos generalizar os 
procedimentos anteriores para a realizagao do teste F como se segue. 


Verifica^ao da significancia geral de uma regressao 
multipla: o teste F 


Dado o modelo de regressao com k variaveis: 

Y, = j8i + >32 X2/ + /S3 X 3, +-f PkXki + u i 

Para testar a hipotese 

Ho'- P 2 = Pi = ■ ■ ■ = fik = 0 

(ou seja, todos os coeficientes angulares sao simultaneamente iguais a zero) versus 

Hy. nem todos os coeficientes angulares sao simultaneamente iguais a zero 
calcule 

= SQE/gl _ SQE/(fc- 1) 

SQR/gl SQR /(n-k) ( 8 . 4 . 7 ) 

Se F> F a (k — 1 , n — k), rejeite H 0 ; caso contrario, nao o rejeite, em que F a (k — 1, n — k) e o valor 
critico de F no nlvel a de significancia; (k — 1), os graus de liberdade do numerador; e (n — k), os graus 
de liberdade do denominador. Como alternativa, se o valor p de F obtido por meio da Equagao 
(8.4.7) for suficientemente baixo, poderemos rejeitar Fi 0 . 


Desnecessario dizer que, no caso de tres variaveis (Y e X 2 , A3), k e igual a 3; no caso de quatro 
variaveis k e igual a 4 e assim por diante. 

Observe que a maioria dos programas para calculo de regressao calcula rotineiramente o valor de 
F (dado na tabela de analise de variancia) com os demais resultados de regressao, como os coeficien¬ 
tes estimados, seus erros padrao, os valores de t etc. A hipotese nula para o calculo de t e, em geral, 
considerada /l, = 0. 

Teste de hipoteses conjunto versus individual 

Na Segao 8.3 discutimos o teste de significancia de um tinico coeficiente de regressao e, na Segao 
8.4, discutimos o teste de significancia geral ou conjunto da regressao estimada (ou seja, todos os 
coeficientes angulares simultaneamente iguais a zero). Reiteramos que esses testes sao diferentes. 
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Com base no teste t ou no intervalo de confianga (da Segao 8.3), e posslvel aceitar a hipotese de que 
dado coeficiente angular, p k , e igual a zero e, ainda assim, rejeitar a hipotese conjunta de que todos os 
coeficientes angulares sao iguais a zero. 

A ligao a ser aprendida e que a “mensagem” conjunta dos intervalos de confianga individuals nao substitui 
uma regiao de confianga conjunta (inferida do teste F) quando se trata de testes conjuntos de hipoteses e 
afirmagoes conjuntas de confianga. 8 


Uma rela^ao importante entre R 2 e F 

Ha uma relagao estreita entre o coeficiente de determinagao R 1 e o teste F empregado na analise 
de variancia. Supondo uma distribuigac normal dos termos de erro m, e a hipotese nula P 2 — P 3 = 0, 
vimos que 


SQE/2 
SQR/(« - 3) 


(8.4.8) 


e distribulda como a distribuigao F com 2 e n — 3 graus de liberdade. 

Em geral, no caso de k variaveis (incluindo o intercepto), se assumirmos que os termos de erro sao 
normalmente distribmdos e que a hipotese nula e 


Ho' Pi - Pi - ■ • • - Pk - 0 


(8.4.9) 


entao 


SQE /{k - 1) 
SQR/(« - k) 


(8.4.7) = (8.4.10) 


segue a distribui 5 ao F com k — I e n — k graus de liberdade. ( Nota: o numero total de parametros a 
serem estimados e k, dos quais 1 e o intercepto.) 

Manipulando a Equa 5 ao (8.4.10): 


n — k SQE 


k 

- 1 SQR 

n 

- k 

SQE 

k 

- 1 STQ - SQE 

n 

- k 

SQE/STQ 

k 

- 11 

- (SQE/STQ) 

n 

- k 

R 2 

k 

- 11 

- R 2 


R 2 /(k- 1) 


(1- R 2 )/(n - k) 


(8.4.11) 


em que se faz uso da definic^ao R 2 — SQE/STQ. A Equa 5 ao (8.4.11) mostra de que forma F e R 2 estao 
relacionados. Os dois variam diretamente. Quando R 2 — 0,Fe zero ipso facto. Quanto maior R 2 , maior 
o valor de F. No limite, quando R 2 — 1, F e infinito. Assim o teste F, que e uma medida de significan- 
cia geral da regressao estimada, e tambem um teste de significancia de R 2 . Em outras palavras, testar 
a hipotese nula na Equagao (8.4.9) e equivalente a testar a hipotese nula de que o R 1 (da populagao) e 
igual a zero. 


FOMBY et at, op.cit. p.42. 
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No caso de tres variaveis, a Equagao (8.4.11) torna-se: 


R 2 /2 

(1 -R 2 )/{n- 3) 


(8.4.12) 


Em virtude da estreita redact entre F e R 2 , a Tabela 8.1 ANOVA pode agora ser reformulada 
como Tabela 8.4. 

Em nosso exemplo ilustrativo, usando (8.4.12), obtemos 


0,7077/2 
(1 - 0,7077)/61 


73,8726 


que e quase o mesmo obtido anteriormente, exceto pelos erros de arredondamento. 

Uma vantagem do teste F expresso em termos de R 2 e sua facilidade de calculo: tudo o que pre- 
cisamos saber e o valor de R 2 . Portanto, o teste geral de significancia F dado na Equa§ao (8.4.7) pode 
ser reformulado em termos de R 2 , como mostra a Tabela 8.4. 


TABELA 8.4 

Tabela ANOVA em 
termos de R 2 


Fonte de variafao 

SQ 

gi 

MSQ* 

Devido a regressao 

« 2 (E/, 2 ) 

2 

k 2 (Ek, 2 )/2 

Devido aos residuos 

d-« 2 )(Ey, 2 ) 

n- 3 

(1 - R 2 )(Ey, 2 )/(n- 3) 

Total 

E /, 2 

n - 1 



*Observe que, ao calcular o valor F nao ha necessidade de multiplicar R 2 e (1 - R 2 ) por >'/, porque eles desaparecem, como 
mostra a Equa^ao (8.4.12). 


Teste de significancia geral, em termos de R 2 , para uma regressao 
multipla 


Regra 


Teste da significancia geral de uma regressao em termos de R 2 : e uma alternativa equivalente 
ao teste dado pela Equagao (8.4.7). 

Dado o modelo de regressao com k variaveis: 

Yi = Pi + P2X2i + P3X3i + —t PxXki + Uj 

Para testar a hipotese 

Ho '■ P2 = @3 = ■ ■ ■ = Pk = 0 


versus 

Hi: nem todos os coeficientes angulares sao simultaneamente iguais a zero 

Calcule 


R 2 /(k~ 1 ) 

(1 _ R2 )/{n _ k) 


( 8 . 4 . 13 ) 


Se F> F a (k- 1 , n -k)' rejeita-se H 0 ; caso contrario, pode-se aceitar H 0 , em que F a ( k - 1 n -*) ® 0 valor 
Fcritico ao nfvel de significancia a e (k — 1) graus de liberdade no numerador e (n — k) graus de 
liberdade no denominador. Como alternativa, se o valor p de F obtido por meio da Equagao 
(8.4.1 3) e suficientemente baixo, rejeita-se /7 0 . 


Antes de continuarmos, voltemos ao Exemplo 7.5 do Capftulo 7. Na regressao (7.10.7), observa- 
mos que o PlB/?cr (PIB per capita relativo) e o P1B per ao quadrado explicam apenas 10,92% da va- 
riac^ao da TCP1B (taxa de crescimento do PIB) dada uma amostra de 190 palses. Esse R 2 de 0,1092 
parece um valor “baixo”. Sera de fato estatisticamente diferente de zero? Como descobrimos isso? 

Recordemos a discussao anterior denominada “uma importante relafao entre R 2 e F”, sobre a 
relac^ao entre os dois valores dados na Equa?ao (8.4.11) ou (8.4.12) no caso especifico de dois regres- 
sores. Como observamos, se R 2 for zero, automaticamente, F sera zero, o que ocorre quando os 
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regressores nao influenciam de forma alguma o regressando. Se inserirmos R 2 — 0,1092 na Formula 
(8.4.12), obtemos: 


0,1092/2 
(1 - 0,1092)/187 


11,4618 


(8.4.13) 


Sob a hipotese nula de que R 2 — 0, o valor de F acima segue a distribuigao F com 2 e 187 graus 
de liberdade no numerador e no denominador, respectivamente. ( Nota: existem 190 observances e 
dois regressores.) Verificamos na tabela de F que esse valor e significativo ao nfvel de 5%; na verda- 
de, o valor p e de 0,00002. Podemos rejeitar a hipotese nula de que os dois regressores nao influen¬ 
ciam o regressando, apesar de R 2 ser de apenas 0,1092. 

Esse exemplo destaca a importante observagao de que, com dados de corte transversal que envol- 
vem varias observagoes, em geral obtemos valores baixos de R 2 em virtude da diversidade das uni- 
dades de corte transversal. Nao deveriamos ficar surpresos ou preocupados ao encontrar R 2 baixos 
em regressoes de corte transversal. O que e relevante e a especificagao correta do modelo, o sinal 
correto dos regressores (aqueles sinais teoricamente esperados) e espera-se que os coeficientes de 
regressao sejam estatisticamente significativos. O leitor deve verificar se os regressores da Equagao 
(7.10.7) sao, individualmente, significativos do ponto de vista estatistico no nivel de 5% ou melhor 
(menor do que 5%). 


A contribuigao "incremental" ou "marginal" de uma variavel 
explanatory 

No Capitulo 7, afirmamos que, geralmente, nao podemos distribuir o valor de R 2 entre os varios 
regressores. No nosso exemplo de mortalidade infantil, verificamos que R 2 era de 0,7077, mas nao 
podemos dizer qual parte desse valor deve-se ao regressor PNBpc e qual deve-se a taxa de alfabeti- 
zagao feminina (TAF) em virtude da possfvel correlagao entre os dois regressores na amostra dispo- 
nrvel. Podemos esclarecer um pouco mais essa questao recorrendo a tecnica de variancia. 

Verificamos, no nosso exemplo ilustrativo, que X 2 (PNBpc) e V 3 (TAF) apresentavam, individual¬ 
mente, significance estatistica com base em testes t ( separados ). Tambem descobrimos que, com 
base no teste F, os dois regressores tinham, conjuntamente, um efeito significativo sobre o regressan¬ 
do Y (mortalidade infantil). 

Imaginemos agora que fagamos a inclusao sequencial de PNB/ji: e TAF; ou seja, primeiro faze- 
mos a regressao da mortalidade infantil contra o PNBpc e avaliamos sua significance e acrescentamos 
TAF ao modelo para verificar se este contribui com algo (obviamente, a ordem em que as variaveis 
entrant no modelo pode ser invertida). Por “contribuigao” queremos dizer que desejamos saber se a 
inclusao/adigao da variavel no modelo aumenta a SQE (e, por conseguinte, R 2 ) “significativamente”, 
em relagao a SQR. Essa contribuigao pode ser chamada, com propriedade, de contribuigao incre¬ 
mental ou marginal de uma variavel explanatoria. 

A questao da contribuigao marginal e importante na pratica. Na maioria das pesquisas, o pesqui- 
sador pode nao estar totalmente convencido de que vale a pena acrescentar uma variavel X ao mo¬ 
delo sabendo que varias outras variaveis X ja estao presentes. Nao se quer incluir variaveis que 
aumentem relativamente pouco a SQE. Mas como decidir se uma variavel X reduz significativamen¬ 
te a SQR? A tecnica da analise de variancia pode ser empregada para responder a essa pergunta. 

Imagine que fagamos inicialmente a regressao da mortalidade infantil contra PNBpc e obte- 
nhamos a seguinte regressao: 

MI, = 157,4244 - 0,0114PNBpc (8.4.14) 

t= (15,9894) (-3,5156) r 2 = 0,1662 

valor p = (0,0000) (0,0008) ajus r 2 = 0,1528 

Como mostram os resultados, o PNBpc influencia significativamente a MI. A Tabela 8.5 apresen- 
ta a ANOVA correspondente a essa regressao. 
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TABELA 8.5 

Tabela ANOVA para a 
regressao (8.4.14) 

Fonte de variagao 

SQE (em virtude do PNBpc) 
SQR 

SQ 

60.449,5 

303.228,5 

g' 

i 

62 

MSQ 

60.449,5 

4890,7822 


Total 

363.678 

63 



Supondo que os termos de erro m ; sejam distribufdos normalmente e com a hipotese de que o 
PNBpc nao influencia diretamente MI, obtemos o valor F de 


60.449,5 

4890,7822 


12,3598 


(8.4.15) 


que segue a distribuigao F com 1 e 62 graus de liberdade. Esse valor de F e altamente significativo, assim 
como o valor de p calculado de 0,0008. Como anteriormente, rejeitamos a hipotese de que PNBpc nao 
influencia a MI. Observe que t 2 — (—3,5156) 2 = 12,3594, que e aproximadamente igual ao valor F da 
Equagao (8.4.14), em que o valor t e obtido por meio da Equagao (8.5.14). Mas isso nao surpreende, 
tendo em vista que o quadrado da estatlstica t com n graus de liberdade e igual ao valor F com 1 gl no 
numerador e n gl no denominador, uma relagao que estabelecemos no Capftulo 5. Neste exemplo, n 
e igual a 64. 

Tendo calculado a regressao (8.4.14), vamos supor que decidimos acrescentar a TAF ao modelo e 
obter a regressao multipla (8.1.4). As questoes que queremos responder sao: 


1. Qual a contribuigao marginal da TAF, sabendo que o PNBpc ja esta no modelo e que se re- 
laciona significativamente com MI? 

2. A contribuigao incremental da TAF e estatisticamente significativa? 

3. Qual o criterio para acrescentar variaveis ao modelo? 

Essas perguntas podem ser respondidas com a tecnica ANOVA. Para tanto, elaboremos a Tabela 
8.6. Nesta, X 2 refcre-se ao PNBpc e X 3 , a TAF. 

Para avaliar a contribuigao incremental de X 3 , depois de levar em conta a contribuigao de X 2 , fa- 
zemos: 

p= 02/gl 

04/gl 

(SQE novo - SQE ve ih 0 )/numero de novos regressores 
SQRnovo/gK = n — numero de parametros no novo modelo) 


02/1 , ( 8 - 4 - 16 ) 

-para o nosso exemplo 

04/61 


TABELA 8.6 

Tabela ANOVA para 
avaliagao da 
contribuigao 
incremental de 
variaveis 


Fonte de variagao 


SQ 

gi 

MSQ 

SQE devido apenas a X 2 

Qi = 

"PhXxl 

i 

Qi 

1 

SQE devido ao acrescimo deX 3 

q 2 = 

Qi - Qi 

i 

Q2 

1 

SQE devido ao acrescimo de X 2 , X 3 

Qb = 

= Pi E Yi x n + Pi E YiXa 

2 

Qi 

2 

SQR 

Qa-- 

- Qs~ Qi 

n- 3 

Qa 

Total 

Qs = 

- Zy? 

n - 1 

n - 3 
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em que SQE novo = SQE sob o novo modelo (ou seja, apos adicionar os novos regressores = Q 3 ), 
SQE velho = SQE no modelo velho (= Q\) e SQR Ilovo = SQR no novo modelo (ou seja, levando em 
conta todos os regressores = Q 4 ). No nosso exemplo, os resultados sao apresentados na Tabela 8.7. 
Agora aplicando (8.4.16), obtemos: 


196.912,9 

1742,8786 


112,9814 


(8.4.17) 


Sob as hipoteses habituais, esse valor de F segue a distribuigao de F com 1 e 62 graus de liberda- 
de. O leitor deve verificar se esse valor de F e altamente significativo a ponto de sugerir que o acres- 
cimo da TAF ao modelo aumente significativamente o valor de SQE e, por conseguinte, de R 1 . 
Portanto, a TAF deve ser adicionada ao modelo. Novamente, observe que, se voce elevar o valor do 
coeficiente da TAF da regressao multipla (8.1.4), que e(—10,6293) 2 , obteremos o valor de F da Equa¬ 
gao (8.4.17), exceto os erros de arredondamento. 

A proposito, a razao de F na Equagao (8.4.16) pode ser reformulada utilizando-se apenas os 
valores de R 2 , como fizemos na Equagao (8.4.13). Como o exerclcio 8.2 mostra, a razao F da 
Equagao (8.4.16) e equivalente a seguinte razao F: 9 


(^novo- ^velj/g 1 

(1 - R 2 0v0 )/gl 

(^novo - ^veiho) / numero de novos regressores 
(l - R 2 ovo )/gl( = n - numero de parametros no novo modelo) 


Essa razao de F segue a distribuigao de F com os graus de liberdade correspondentes no numera- 
dor e no denominador, 1 e 61 no nosso exemplo ilustrativo. 

Assim, em nosso exemplo, R 2 0V0 — 0,7077 (da Equagao (8.1.4)) e /? 2 e]ho — 0,1662 (da Equagao 
(8.4.14)). Portanto, 


(0,7077- 0,1662)/1 
(1 - 0,7077)/61 


113,05 


(8.4.19) 


que e aproximadamente igual ao obtido na Equagao (8.4.17), exceto pelos erros de arredondamento. 
Esse F e altamente significativo, reforgando nossa descoberta anterior de que a variavel TAF pertence 
ao modelo. 

Uma advertencia: ao empregar a versao do R 2 para o teste Taprcsciitado em (8.4.11), certifique-se 
de que a variavel dependente dos modelos novos e antigos seja a mesma. Se forem diferentes, use o 
teste F da Equagao (8.4.16). 


TABELA 8.7 

Tabela ANOVA para 
o exemplo: analise 
incremental 


Fonte de variagao 

SQ 

gi 

MSQ 

SQE devido apenas ao PNBpc 

60.449,5 

i 

60.449,5 

SQE devido ao acrescimo da TAF 

196.912,9 

i 

196.912,9 

SQE devido tanto a PNBpc quanto a TAF 

257.362,4 

2 

128.681,2 

SQR 

106.315,6 

61 

1742,8786 

Total 

363.678 

63 



9 0 teste Fa seguir e um caso especial do teste Fmais geral da Equagao (8.6.9) ou (8.6.10) na Segao 8.6. 
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Quando acrescentar uma nova variavel 

0 procedimento apresentado para o teste F fornece um metodo formal para decidir se devemos 
adicionar uma variavel ao modelo de regressao. Frequentemente, os pesquisadores sao confrontados 
com a tarefa de escolher entre varios modelos que envolvem a mesma variavel dependente, mas 
diferentes variaveis explanatorias. Ao fazerem uma escolha ad hoc (porque com muita frequencia o 
fundamento teorico da analise e fraco), esses pesquisadores escolhem o modelo que proporciona o R 2 
ajustado mais alto. Se a inclusao de uma variavel aumenta R 2 , ela e mantida no modelo mesmo que 
nao reduza significativamente, no sentido estatistico, a soma dos quadrados do residuo. A questao e: 
quando o R 2 ajustado aumenta? Pode-se demonstrar que R 1 aumenta se o valor absoluto do coeficiente 
da nova variavel incluida for maior que 1 , e o valor de t for calculado sob a hipotese de que o valor do 
referido coeficiente na populapao seja zero (o valor de t calculado por meio da Equa£ao (5.3.2) sob a 
hipotese de que o verdadeiro [! seja igual a zero) 10 . Esse criterio tambem pode ser expresso de forma 
diferente: R 2 aumentara com o acrescimo de uma nova variavel explanatoria apenas se o valor de 
F( — t 2 ) for superior a 1. 

Sob qualquer dos criterios aplicados, a variavel TAF do exemplo da mortalidade infantil com 
valor t de —10,6293 ou um valor F de 112,9814 devera aumentar o R 2 , como de fato ocorre - quando 
TAF e acrescentado ao modelo, R 2 aumenta de 0,1528 para 0,6981. 

Quando acrescentar um grupo de variaveis 

Podemos formular uma regra semelhante para decidir se vale a pena adicionar (ou excluir) um 
grupo de variaveis ao modelo? A resposta deveria ser clara por meio da Equapao (8.4.18): se incluir 
(excluir) um grupo de variaveis ao modelo resulta em um valor F maior (menor) que 1, R 2 aumenta- 
rd ( diminuira ). Naturalmente, com a Equapao (8.4.18), podemos verificar facilmente se o acrescimo 
(exclusao) de um grupo de variaveis aumenta (reduz) significativamente o poder explanatorio de um 
modelo de regressao. 


8.5 Teste da igualdade para dois coeficientes de regressao 


Imaginemos que, na regressao lmiltipla 

Yj = fi\ + faXii + PiXn + p 4 X 4i + Uj 

desejamos testar as hipoteses 

Ho'- Pi = P 4 ou (P 3 - Pf) = 0 

Hi'. Pi f P 4 ou (Pi - p 4 ) / 0 

ou seja, testar se os dois coeficientes angulares, Pi e /i 4 , sao iguais. 

Essa hipotese nula e de importancia pratica. Por exemplo, seja a Equa 5 ao (8.5.1) a fun 5 ao demanda 
de um bem, em que Y — quantidade demandada do bem; X 2 = pre 50 do bem; X 2 — renda do consumi- 
dor; e I 4 = riqueza do consumidor. Neste caso, a hipotese nula significa que os coeficientes da 
renda e da riqueza sao os mesmos. Ou, se Yj e os X forem expressos em forma logarftmica, a hipotese nula 
na Equa^ao (8.5.2) implica que as elasticidades renda e riqueza do consumo sao iguais. (Por que?) 

Como testamos uma hipotese nula desse tipo? Sob as hipoteses classicas, podemos demons¬ 
trar que: 


(8.5.1) 


(8.5.2) 


(A- A) - (Pi - A) 
ep (A ~ A) 


(8.5.3) 


10 Para uma demonstrafao, veja AIGNER, Dennis J. Basic econometrics. Englewood Cliffs, N.J.: Prentice Hall, 1971. 
p. 91-92. 
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EXEMPLO 8.2 

Retomando a 
funqao ciibica 


segue a distribui^ao t com (n — 4) graus de liberdade, porque a Equa£ao (8.5.1) e um modelo com 
quarto variaveis ou, de forma mais geral, com (n — k) graus de liberdade, em que k 6 o numero total 
de parametros estimados, incluindo o termo constante. O erro padrao ep(ft — ft) e obtido por meio da 
seguinte formula bem conhecida (veja detalhes no Apendice A): 


ep(ft - ft) = V var (ft) + var(ft) - 2cov(ft, ft) 


(8.5.4) 


Se substituirmos a hipotese nula e a expressao para (ft — ft), na Equagao (8.5.3), nosso teste 
estatlstico torna-se: 

ft - ft 


ar(ft) + var (ft) - 2cov(ft, ft) 
Agora o processo de teste envolve os seguintes passos: 


(8.5.5) 


1. Estimamos ft e ft. Qualquer programa padrao de computador faz isso. 

2. A maioria dos programas calcula rotineiramente as variancias e covariancias dos parametros 
estimados 11 . Com base nessas estimativas, e facil obter o erro padrao do denominador para 
a Equa§ao (8.5.5). 

3. Obtemos a razao t por meio da Equapao (8.5.5). Observe que a hipotese nula, neste caso, e 

0«3 - ft) = 0. 

4. Se a variavel t calculada por meio da Equa 5 ao (8.5.5) for maior que o valor crftico de t no 
nivel de significance proposto para dados graus de liberdade, poderemos rejeitar a hipotese 
nula; caso contrario, nao a rejeitaremos. Como alternativa, se o valor p da estatfstica t da 
Equa 5 ao (8.5.5) for razoavelmente baixo, poderemos rejeitar a hipotese nula. Portanto, 
quando dizemos que o valor p e baixo ou razoavelmente baixo, queremos dizer que e inferior 
ao nivel de significance, seja 10%, 5% ou 1%. 


Essa decisao envolve certa avaliagao pessoal. 


Recordemos a funfao cubica de custo total estimada no Exemplo 7.4, Se^ao 7.10, que, 
por convenience, e reproduzida a seguir: 

Yi = 141,7667 + 63,4777X, - 12,9615X?+ 0,9396X, 3 

ep= (6,3753) (4,7786) (0,9857) (0,0591) ( 7 . 10 . 6 ) 

cov(ft, ft) = - 0,0576; R 2 = 0,9983 

em que Ye o custo total e X a produ^ao, e os numeros entre parenteses sao os erros padrao 
estimados. 

Suponha que queiramos testar a hipotese de que os coeficientes dos termos X 2 e X 3 da 
fungao ciibica de custo sao iguais, ou seja, ft = ft ou (ft — ft) = 0. Na regressao (7.10.6) 
temos todos os resultados necessarios para conduzir o teste t da Equa^ao (8.5.5). A mecanica 
envolvida e a seguinte: 


t = 


ft - ft 


\/var(ft) + var (ft) - 
-12,9615- 


2cov(ft, ft) 
0,9396 


ft(0,9867) 2 + (0,0591 ) 2 - 2(-0,0576) 
-1 3,9011 


1,0442 


= - 13,3130 


( 8 . 5 . 6 ) 


( Continua ) 


11 A expressao algebrica da formula da covariancia e bastante complicada. No Apendice C, oferecemos uma ex¬ 
pressao compacta, mas que usa notagao matricial. 
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EXEMPLO 8.2 

( Continuagao ) 


O leitor pode verificar que, com 6 graus de liberdade (por que?), o valor f observado e supe¬ 
rior ao valor t crftico mesmo ao nfvel de significance de 0,002 (ou 0,2%) considerando-se um 
teste bicaudal; o valor p e extremamente pequeno, 0,000006. Portanto, podemos rejeitar a 
hipotese de que os coeficientes de X 2 e X 3 da fungao cubica de custo sejam identicos. 


8.6 Mmimos quadrados restritos: teste de restrigoes de igualdade 
linear 

Ha ocasioes em que a teoria economica sugere que os coeficientes de um modelo de regressao 
estao sujeitos a algum tipo de restrigao de igualdade linear. Por exemplo, considere a fungao de pro- 
dugao Cobb-Douglas: 

Y, = PiX%X$e Ul (7.9.1) = (8.6.1) 

em que Y = produgao, X 2 = insumo trabalho e X 2 = insumo capital. Na sua forma logarftmica, a 
equagao torna-se 

In Yj = p 0 + lnX 2 i + lnX 3 ; + m, (8.6.2) 


em que fi 0 — in p x . 

Agora, se houver retornos constantes de escala (variagao equiproporcional da produgao para uma 
variagao equiproporcional nos insumos), a teoria economica sugere que: 

Pi + Pi = 1 (8.6.3) 


que e um exemplo de restrigao de igualdade linear. 12 

Como podemos descobrir se existem retornos constantes de escala, ou seja, se a restrigao (8.6.3) 
e valida? Ha duas abordagens. 

A abordagem do teste t 

O processo mais simples e estimar a Equagao (8.6.2) da maneira habitual, sem levar em conta 
explicitamente as restrigoes de (8.6.3). Isso e chamado de regressao sem restrigoes ou irrestrita. 
Tendo estimado p 2 e /? 3 (por exemplo, por meio dos mmimos quadrados ordinarios), um teste de hi¬ 
potese ou restrigao (8.6.3) pode ser conduzido pelo teste t apresentado na Equagao (8.5.3), a saber, 

t _ (Pi + Pi) ~ (Pi + Pi) 
e P (Pi + Pi) 

= _ (Pi + Pi)~ 1 _ ( 8 - 6 - 4 ) 

Jvar(p 2 ) + var(p 2 ) + 2 cov( / S 2 , Pi) 


em que (Ji 2 + /i 3 ) e a hipotese nula e o denominador e o erro padrao de (p 2 + p 2 ). Entao, de acordo com 
a Segao 8.5, se o valor 1 calculado na Equagao (8.6.3) for maior que o valor 1 crftico no nfvel de signi- 
ficancia escolhido, rejeitaremos a hipotese de retornos constantes de escala; caso contrario, nao o re- 
jeitaremos. 


12 


Se tivessemos P 2 +Pi< b essa relagao seria um exemplo de restrigao de desigualdade linear. Para lidar com essas 
restrigoes, e preciso recorrer a tecnicas de programagao matematica. 








262 


Parte Um 


Modelos de regressao com equagao imica 


A abordagem do teste F: rmnimos quadrados restritos 

0 teste t apresentado e uma especie de exame post mortem, porque tentamos verificar se a restri¬ 
gao linear e satisfeita depois de estimar a regressao “sem restrigoes”. Uma abordagem direta seria 
incorporar, desde o infcio, a restrigao (8.6.3) ao procedimento de estimagao. No exemplo em pauta, 
isso poderia ser feito facilmente. Por meio de (8.6.3), vemos que: 

ft = 1 - ft (8.6.5) 

ou 

ft = 1 - ft (8.6.6) 

Ao empregarmos qualquer uma dessas igualdades, podemos eliminar um dos coeficientes fi na 
Equagao (8.6.2) e estimar a equagao resultante. Se usarmos a Equagao (8.6.5), podemos escrever a 
fungao de produgao Cobb-Douglas como: 

In Yi = ft + (1 - ft) In X 2l + ft lnX 3 , + u, 

= ft + In X 2 i + ft (In 2ft — In Aft) + m, 
ou 

(In Yt - In Aft) = ft + ft (In Aft - In Aft) + u, (8.6.7) 


ou 


\r\(Yi/X 2i ) - ft + ft In (Aft/Aft ) + «,■ (8.6.8) 


em que (Yj/X 2i ) — razao produgao/trabalho e (X ii /X 2j ) — razao capital/trabalho, indicadores de grande 
importancia economica. 

Observe a transformagao da Equagao original (8.6.2). Como estimamos ft por meio da Equagao 
(8.6.7) ou (8.6.8), ft pode ser calculado facilmente com base na relagao (8.6.5). E desnecessario dizer 
que esse procedimento garante que a soma dos coeficientes estimados dos dois insumos sera igual a 
1. O procedimento esbogado na Equagao (8.6.7) ou (8.6.8) e conhecido como mmimos quadrados 
restritos (MQR) e pode ser generalizado para modelos com qualquer numero de variaveis explana- 
torias e mais de uma restrigao linear de igualdade. A generalizagao pode ser encontrada em Theil. 13 
(Veja tambem o teste F geral a seguir.) 

Como comparamos as regressoes com minimos quadrados irrestritos e restritos? Em outras palavras, 
como sabemos que a restrigao, por exemplo, (8.6.3) e valida? A pergunta pode ser respondida apli- 
cando-se o teste F apresentado a seguir. Seja 


Yl ^SR — SQR da regressao sem restrigoes (8.6.2) 

Mr = SQR da regressao com restrigoes (8.6.7) 
m — numero de restrigoes lineares (neste exemplo, 1) 
k = numero de parametros da regressao sem restrigoes 
n = numero de observagoes 


Entao, 

p= (SQRr-SQR S r )/m 
SQRsr/(« - k) 

= (E«r- E»sr)A” 
E«sr/(« - k ) 


(8.6.9) 


13 


THEIL, Henri. Principles of econometrics. Nova York: John Wiley & Sons, 1971. p. 


43-45. 
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segue a distribuigao F com m e (n — k) graus de liberdade. ( Nota: SR e R representam as regressoes 
sem restrigoes e com restrigoes, respectivamente.) 

Esse teste F tambem pode ser expresso em termos de R 2 : 


F = 


( R L - R i)/ m 

(i-*2r)/(«-*) 


( 8 . 6 . 10 ) 


em que R 2 sr e R 2 r sao, respectivamente, os valores de R : obtidos nas regressoes sem e com restrigoes, 
ou seja, das regressoes (8.6.2) e (8.6.7). Deve-se observar que: 


^sr - ^R 


E« 2 sr s 


.-2 


( 8 . 6 . 11 ) 

( 8 . 6 . 12 ) 


No Exercicio 8.4, sera pedido a voce que justrfique essas afirmagoes. 

Uma advertencia : ao empregar a Equagao (8.6.10), lembre-se de que, se a variavel dependente 
nos modelos com e sem restrigao nao for a mesma, R | R e R 2 r nao poderao ser comparados diretamen- 
te. Nesse caso, deve-se empregar o procedimento descrito no Capftulo 7 para tornar os valores de R 2 
comparaveis (veja Exemplo 8.3) ou usar o teste F apresentado na Equagao (8.6.9). 


EXEMPLO 8.3 

Fungao de 

produgao 

Cobb-Douglas 

para a economia 

mexicana, 

1955-1974 


Para ilustrar a discussao anterior, considere as informagoes da Tabela 8.8. Tentamos ajus- 
tar a elas a fungao de produgao Cobb-Douglas, o que produziu os seguintes resultados: 


In PIB t = - 1,6524 + 0,3397 In Trabalho t + 
t= (-2,7259) (1,8295) 

valor p= (0,0144) (0,0849) 

R 2 = 0,9951 


0,8460 In Capital 
(9,0625) 

( 0 , 0000 ) 

SQR sr = 0,0136 


(8.6.13) 


TABELA 8.8 

Ano 

PIB* 

Trabalhot 

Capital fixo* 

Mexico - PIB real. 

trabalho e capital 

1955 

114043 

8310 

182113 

fixo real 

1956 

120410 

8529 

193749 

1957 

129187 

8738 

205192 

Fonte: ELIAS, Victor J. 

1958 

134705 

8952 

215130 

Sources of growth : a 
study of seven Latin 

American economies. 

1959 

139960 

9171 

225021 

1960 

150511 

9569 

237026 

International Center for 

1961 

157897 

9527 

248897 

Economic Growth, San 

1962 

165286 

9662 

260661 

Francisco: ICS Press, 

1963 

178491 

10334 

275466 


E5, E12, E14. 

1964 

199457 

10981 

295378 

1965 

212323 

11746 

315715 


1966 

226977 

11521 

337642 


1967 

241194 

11540 

363599 


1968 

260881 

12066 

391847 


1969 

277498 

12297 

422382 


1970 

296530 

12955 

455049 


1971 

306712 

13338 

484677 


1972 

329030 

13738 

520553 


1973 

354057 

15924 

561531 


1974 

374977 

14154 

609825 


*Milhoes de pesos mexicanos de 1960. 

tMilhares de pessoas. 

tMilhoes de pesos mexicanos de 1960. 


(_Contin.ua) 
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EXEMPLO 8.3 

(' Continuagdo ) 


em que SQR S r e a SQR sem restri^oes, ja que nao impusemos quaisquer restrifoes na estima- 
tiva da Equagao (8.6.1 3). 

Ja vimos no Capftulo 7 como interpretar os coeficientes da fun^ao da produfao Cobb- 
-Douglas. Como voce pode ver, a elasticidade produg:ao-trabalho e de cerca de 0,34 e a da 
rela^ao produ^ao-capital e de cerca de 0,85. Se somarmos esses coeficientes, obteremos 1,19 
sugerindo que e possfvel que a economia mexicana registrasse retornos crescentes de escala 
no perfodo estudado. Obviamente, nao sabemos se 1,19 difere estatisticamente de 1. 

Para verificar se esse e o caso, vamos impor a restrigao de retornos de escala constantes, 
o que resulta na seguinte regressao: 

In (PIB/Trabalho) t = - 0,4947 + 1,0153 In (Capital/Trabalho) t ( 8 . 7 . 14 ) 

t = (-4,0612) (28,1056) 

valor p = (0,0007) (0,0000) 

Rr= 0,9777 SQR r = 0,0166 

em que SQR r e a SQR com restrifoes, uma vez que impusemos a condigao de que existem 
retornos constantes de escala. 

Como nas duas regressoes anteriores as variaveis dependentes sao diferentes, precisamos 
empregar o teste F da Equafao (8.6.9). Temos os dados necessarios a obtengao do valor F. 

(SQRr-SQRsr )/m 
SQRsr/ (n - k) 

_ (0,0166- 0,01 36)/1 

~ (0,01 36)/(20 - 3) 

= 3,75 

Observe que, neste caso, m = 1, ja que impusemos apenas uma restrigao e (n — k) = 1 7, 
uma vez que temos 20 observa^oes e tres parametros na regressao sem restri^oes. 

Este valor de F segue a distribuigao de Fcom 1 grau de liberdade no numerador e 1 7 no 
denominador. O leitor podera verificar facilmente que este F nao e significativo no nfvel de 
significance de 5%. (Veja o Apendice D, Tabela D.3) 

A conclusao e de que a economia mexicana provavelmente caracterizou-se por retornos 
constantes de escala no perfodo estudado, portanto, nao ha prejufzo em empregar a regres¬ 
sao com restrigoes da Equagao (8.6.14). Como ela mostra, se a razao capital/trabalho aumen- 
tar 1%, em media, o aumento da produtividade do trabalho provavelmente sera de 1%. 


Teste Fgeral 14 

O teste F da Equa§ao (8.6.10) ou seu equivalente da Equa 5 ao (8.6.9) fornece um metodo para 
teste de hipoteses sobre um ou mais parametros do modelo de regressao com k variaveis: 

Y, = P\ + PiXn + + ••• + PkXki + Ui (8.6.15) 

O teste de F da Equa 5 ao (8.4.16) ou o teste t da Equapao (8.5.3) e apenas uma aplicapao especifi- 
ca da Equa 5 ao (8.6.10). Assim, hipoteses tais como 


Ho-P2 - Pi 

Ho: Pi + ^4 + Ps = 3 


(8.6.16) 

(8.6.17) 


14 Quando se emprega a abordagem de maxima verossimilhanga para a estimagao, um teste semelhante ao exa- 
minado e o teste da razao de verossimilhan^a, que e algo complicado e, portanto, sera tratado no apendice 
do capftulo. Mais detalhes podem ser encontrados em THEIL, op.cit, p. 1 79-184. 
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que envolvem alguma restrigao linear aos parametros do modelo com k variaveis, ou hipoteses como 

H 0 :fc= fa= p 5 = 0 6 = 0 (8.6.18) 

que implicam ausencia de alguns dos regressores do modelo, podem ser todas testadas pelo teste de F 
da Equagao (8.6.10). 

Do que foi discutido nas Secoes 8.4 e 8.6, o leitor tera observado que a estrategia do uso do teste 
F e esta: ha um modelo maior, o modelo sem restricoes (8.6.15), e ha um modelo menor, o modelo 
com restrigoes , que e obtido eliminando-se algumas variaveis do maior, ou seja, pela Equa^ao 
(8.6.18), ou pela imposifao de algumas restrifoes lineares a um ou mais coeficientes do modelo 
maior, isto e, pela Equa?ao (8.6.16) ou na (8.6.17). 

Entao, ajustamos os modelos, com restr^oes e sem restr^oes, aos dados e obteremos os respecti- 
vos coeficientes de determina 9 ao, a saber, R 2 sr e R 2 r . Observamos os gratis de liberdade do modelo 
sem restr^oes (= n — k) e os do modelo com restr^oes (= tri), sendo m o numero de restricoes lineares 
(ou seja, 1 na Equacao (8.6.16) ou na (8.6.18)) ou o numero de regressores omitidos do modelo (por 
exemplo, m — 4 se adotamos a Equacao (8.6.18), ja que quatro regressores foram omitidos do mode¬ 
lo). Entao, calculamos a razao F como indicado na Equacao (8.6.9) ou na (8.6.10) e adotamos a se- 
guinte regra: se o F calculado e maior que F a (m, n — k ), em que F a (m, n — k) e o F critico ao nivel 
de significdncia a, rejeitamos a hipotese nula; caso contrario, nao a rejeitamos. 

Vamos ilustrar: 


EXEMPLO 8.4 

Demanda de 
frango nos 
Estados Unidos, 
1960-1982 


No Exercfcio 7.9, dentre outras coisas, voce a considerou a seguinte fungao de deman¬ 
da por frango: 


In Y t - f }i + jl 2 In X 21 + Pi In X^ t + /?4 In X 4 t + fl 5 In Xst + u, ( 8 . 6 . 19 ) 


em que Y = consumo per capita de frango, em libras-peso; X 2 = renda real disponfvel 
per capita, em $; X 3 = prego real do frango no varejo, em centavos de dolar por libra-peso; 
X 4 = prefo real da came sufna no varejo, em centavos de dolar por libra-peso; e X s = prego 
da carne bovina no varejo, em centavos de dolar por libra-peso. 

Nesse modelo, f} 2 , @ 3 , P 4 e /3 S sao, respectivamente, as elasticidades renda, prefo pro- 
prio, prefo cruzado (carne sufna), prego cruzado (carne bovina). (Por que?) Segundo a teoria 
economica. 


p2>0 
fh <0 

/?4 > 0 , se as carnes de frango e sufna forem produtos substitutes 

< 0 , se as carnes forem produtos complementares 

= 0 , se as carnes de frango e sufna nao tiverem substitutes 

/S 5 > 0 , se as carnes de frango e bovina forem produtos substitutes 

< 0 , se as carnes forem produtos complementares 

= 0 , se as carnes de frango e bovina nao tivrem relafao 


( 8 . 6 . 20 ) 


Suponha que alguem afirme que as carnes de frango, sufna e bovina sao produtos sem 
qualquer relafao no sentido de que o consumo de frango nao e afetado pelo pre 90 das car¬ 
nes sufna e bovina. Em resumo. 


Ho: >84 = Ps = 0 


( 8 . 6 . 21 ) 


Portanto, a regressao com restricoes sera: 


In Y t = fa + In X 2t + Ps In X 3t + u t 


( 8 . 6 . 22 ) 


( Continua ) 
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EXEMPLO 8.4 A Equa^ao (8.6.19) e, obviamente, a regressao sem restri^oes. 

( Continuagao ) Com os dados do Exercfcio 7.19, obtemos os seguintes resultados: 

Regressao sem restrigoes: 

IrTVf = 2,1898 + 0,3425 In X 2t - 0,5046 In X 3t + 0,1485 In X 4f + 0,0911 In X 5t 
(0,1557) (0,0833) (0,1109) (0,0997) (0,1007) 

Rl r = 0,9823 

( 8 . 6 . 23 ) 

Regressao com restrigoes: 

lnV t = 2,0328 + 0,4515lnX 2t - 0,3772 In X 3t 

(0,1162) (0,0247) (0,0635) ( 8 . 6 . 24 ) 

Rr = 0,9801 

em que os numeros entre parenteses sao os erros padrao estimados. Nota: os valores de R 2 
das Equates (8.6.23) e (8.6.24) sao comparaveis, ja que a variavel dependente dos dois 
modelos e a mesma. 

Agora a razao Fpara testar a hipotese da Equafao ( 8.6.21) e 

f = (^SR ~ Ml ^ 

(1 - R 2 SR )/(n- k) 

O valor de m neste caso e 2, pois ha duas restrigoes envolvidas 
de liberdade do denominador, (n — k), sao 18, ja que n = 23 e k ■ 

Portanto a razao de F e: 

(0,9823- 0,9801 )/2 

~ (1 - 0,9823)/18 ( 8 . 6 . 25 ) 

= 1,1224 

que tem distribuigao Fcom 2 e 18 graus de liberdade. 

A 5%, e claro que esse valor de Fnao tem significancia estatfstica [ F 0 S (2,18) = 3,55]. O 
valor p e 0,3472. Nao ha razao para rejeitar a hipotese nula — a demanda por frango nao 
depende dos pregos das carnes sufnas e bovinas. Em resumo, podemos aceitar a regres¬ 
sao com restrifoes (8.6.24) como representativa da fungao demanda de frango. 

Observe que a fun^ao demanda satisfaz as expectativas economicas a priori, ja que a elas- 
ticidade pre^o propria e negativa e a elasticidade renda e positiva. Contudo, a elasticidade- 
-prefo estimada, em valor absoluto, e estatisticamente menor que um, implicando que a 
demanda por frango e inelastica em relag:ao ao prego. (Por que?) Tambem a elasticidade 
renda, embora positiva, e estatisticamente menor que um, o que sugere que o frango nao e 
um bem de luxo; por conven^ao, considera-se que bens de luxo sao aqueles cuja elasticidade 
renda e maior que 1 . 


( 8 . 6 . 10 ) 

: p 4 = 0 e f} 5 = 0. Os graus 
= 5 (5 coeficientes /8). 


8.7 Teste da estabilidade estrutural on dos parametros nos modelos 
de regressao: o teste de Chow 

Quando utilizamos um modelo de regressao que envolve o uso de series temporais, pode aconte- 
cer que se verifique uma mudanca estrutural na rela 5 ao entre o regressando e os regressores. 

Por mudan 5 a estrutural entendemos que os valores dos parametros do modelo nao se mantem 
iguais durante todo o perfodo de tempo. As vezes, a mudanca estrutural decorre de for 5 as externas 
(por exemplo, os embargos do petroleo impostos pela Opep em 1973 e 1979 ou a Guerra do Golfo de 
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1990—1991) ou por mudancas na polltica economica (como a passagem de um sistema de cambio 
fixo para outro de taxa flutuante por volta de 1973) ou por apoes tomadas pelo Congresso (como as 
mudancas tributarias promovidas pelo presidente Reagan ou alteranoes do salario mlnimo) ou varias 
outxas causas. 

Como podemos verificar que ocorreu, de fato, uma mudanpa estrutural? Para ser especifico, ve- 
jamos os dados apresentados na Tabela 8.9. Essa Tabela apresenta os dados sobre a renda pessoal 
disponivel e as poupanpas pessoais, em bilhbes de $, dos Estados Unidos no periodo 1970 a -1995. 
Suponha que queiramos estimar uma funcao poupanna simples que relacione a poupanna ( Y) com a 
renda pessoal disponivel, RPD (X). Uma vez que temos os dados, podemos calcular uma regressao 
de Y contra X usando os mlnimos quadrados ordinarios. Mas, ao fazermos isso, estamos sustentando 
que a relagao entre poupanca e renda pessoal disponivel nao mudou muito nesse periodo de 26 anos. 
Essa pode ser uma hipotese muito forte. Por exemplo, sabe-se que, em 1982, os Estados Unidos re- 
gistraram sua pior recessao em tempos de paz. A taxa de desemprego civil atingiu 9,7% nesse ano, 
a mais alta desde 1948. Um evento dessa grandeza poderia perturbar a relagao entre poupanca e 
renda. Para verificarmos se isso aconteceu, podemos dividir os dados da amostra em dois periodos: 
1970-1981 e 1982-1995, ou seja, os periodos anterior e posterior a recessao de 1982. 

Temos agora tres posslveis regressoes: 


Periodo de 

1970-1981: Y, = 

Al + X 2 X, + U\ t 

n 1 = 12 

(8.7.1) 

Periodo de 

1982-1995: Y, = 

Y\ + YiXt + u 2t 

n 2 = 14 

(8.7.2) 

Periodo de 

1970-1995: Y, = 

Of 1 4- (X2Xf + Uf 

n = {n\ + M 2 ) = 26 

(8.7.3) 


A regressao (8.7.3) pressupoe que nao ha diferenga entre os dois periodos e estima a relagao entre 
poupanca e renda pessoal para todo o periodo, que consiste em 26 observances. 

Em outras palavras, essa regressao considera que o intercepto e o coeficiente angular da re¬ 
gressao permanecem os mesmos durante todo o periodo, ou seja, nao se verifica mudanga estru¬ 
tural. Se esta for, de fato, a situagao, entao a\ = ^ = y! e a 2 — ^2 = Y 2 - 

As regressoes (8.7.1) e (8.7.2) pressupoem que as regressoes dos dois periodos sejam diferentes; 
o intercepto e os coeficientes angulares diferem, como indicado pelos parametros com subscritos. 
Nas regressoes, os u representam os termos de erro e os n, o numero de observances. 

Para os dados apresentados na Tabela 8.9, as contrapartidas das tres regressoes anteriores sao as 
seguintes: 

Y,= 1,0161 + 0,0803 X t 

t= (0,0873) (9,6015) (8.7.1a) 

R 2 = 0,9021 SQR! = 1785,032 gl = 10 


TABELA 8.9 

Estados Unidos - 
poupanga e renda 
pessoal disponivel 
(em bilhoes de $), 
1970-1995 

Fonte: Economic Report 
of the President, 


Observafao 

Poupanca 

Renda 

Observanao 

Poupanca 

Renda 

1970 

61,0 

727,1 

1983 

167,0 

2522,4 

1971 

68,6 

790,2 

1984 

235,7 

2810,0 

1972 

63,6 

855,3 

1985 

206,2 

3002,0 

1973 

89,6 

965,0 

1986 

196,5 

3187,6 

1974 

97,6 

1054,2 

1987 

168,4 

3363,1 

1975 

104,4 

1159,2 

1988 

189,1 

3640,8 

1976 

96,4 

1273,0 

1989 

187,8 

3894,5 

1977 

92,5 

1401,4 

1990 

208,7 

4166,8 

1978 

112,6 

1580,1 

1991 

246,4 

4343,7 

1979 

130,1 

1 769,5 

1992 

272,6 

4613,7 

1980 

161,8 

1973,3 

1993 

214,4 

4790,2 

1981 

199,1 

2200,2 

1994 

189,4 

5021,7 

1982 

205,5 

2347,3 

1995 

249,3 

5320,8 
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FIGURA 8.3 


Y, = 153,4947 + 0,0148X, 
t= (4,6922) (1,7707) 

R 1 2 = 0,2971 SQR 2 = 10.005,22 gl = 12 

Y, = 62,4226 + 0,0376 X, 
t= (4,8917) (8,8937) 

R 2 = 0,7672 SQR 3 = 23.248,30 gl = 24 


(8.7.2a) 


(8.7.3a) 


Nas regressoes anteriores, a SQR indica a soma do quadrado dos reslduos e os numeros entre parente- 
ses sao os valores 1 estimados. 

A observa§ao das regressoes estimadas sugere que a rela 9 ao entre a poupanca e a renda pessoal 
disponlvel nao e a mesma nos dois subperiodos. O coeficiente angular das regressoes de poupanca 
contra renda representa a propensao marginal a poupar (PMP), ou seja, a variayao (media) das 
poupan 9 as decorrentes do aumento de um dolar na renda pessoal disponlvel. No perlodo 1970- 
-1981, a PMP era de cerca de 0,08, enquanto no periodo 1982-1995, era de cerca de 0,02. E dificil 
dizer se essa mudan 9 a foi decorrente das pollticas economicas implementadas pelo presidente 
Reagan. Mas isso sugere que a regressao combinada (8.7.3a) - aquela que reune todas as 26 
observa 9 oes em uma regressao comum, desconsiderando posslveis diferen 9 as nos dois perlodos - 
pode nao ser adequada. Obviamente, a afirma 9 ao anterior deve ser apoiadapelos testes estatisticos 
pertinentes. A proposito, o diagrama de dispersao e as linhas de regressao estimadas sao apresen- 
tados na Figura 8.3. 

Agora as posslveis diferen 9 as, ou seja, as mudan 9 as estruturais, podem ser provocadas por dife- 
ren 9 as no intercepto ou no coeficiente angular, ou em ambos. Como descobrimos isso? Uma impres- 
sao visual pode ser obtida na Figura 8.3. Mas seria util ter um teste formal. 

Este e o lugar em que o teste de Chow vem a calhar. 15 Ele pressupoe que: 

1. u u ~ N( 0, a 2 ) e u 2 , ~ A'(0, a 2 ). Isto e, os termos de erro nas regressoes dos subperiodos 
distribuem-se normalmente com a mesma variancia (homocedastica) a 1 . 

2. Os dois termos de erro, u u e u 2t , tem distributes independentes. 


1970-1981 1982-1995 




Renda Renda 


15 CHOW, Gregory C. "Tests of equality between sets of coefficients in two linear regressions". Econometrica, v. 28, 
n. 3, 1960. p. 591-605. 
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A mecanica do teste de Chow e a seguinte: 

1. Estima-se a regressao (8.7.3), que sera adequada se nao houver instabilidade dos parametros, e 
obtem-se SQR com {ti\ + n 2 — k) graus de liberdade, em que k e o numero de parametros estimados, 
2 neste caso. Em nosso exemplo, SQR3 = 23.248,30. Chamamos SQR3 de soma restrita dos qua- 
drados dos resfduos (SQRr) porque e obtida pela impos^ao da restr^ao de que iQ = y\ e 7. 2 = y 2 , 
ou seja, as regressoes dos subperfodos nao sao diferentes. 

2. Estima-se a Equa£ao (8.7.1) e obtem-se a soma dos quadrados dos resfduos SQR h com («, — k) 
graus de liberdade. Em nosso exemplo, SQR] = 1.785,032 e 10 graus de liberdade. 

3. Estima-se a Equa§ao (8.7.2) e obtem-se a soma dos quadrados dos resfduos, SQR 2 , com (n 2 — k) 
graus de liberdade. Em nosso exemplo, SQR 2 = 10.005,22 e 12 graus de liberdade. 

4. Ja que consideramos que os dois conjuntos de amostras sao independentes, podemos somar 
SQR, e SQR 2 para obter o que podemos chamar de soma sem restricoes dos quadrados dos resf- 
duos (SQR sr ), que e: 

SQRsr = SQRi + SQR 2 com gl = («i + n 2 - 2k) 


Neste caso, 


SQRsr = (1785,032+ 10.005,22)= 11.790,252 


5. Agora, a ideia subjacente ao teste de Chow e que, se nao ha mudanca estrutural, (ou seja, se as 
regressoes (8.7.1) e (8.7.2) sao essencialmente iguais), entao a SQR r e a SQR sr nao deveriam ser 
estatisticamente diferentes. Portanto, tomando a razao 


(SQRr- SQRsr )/k 
(SQR sr )/(«i+ n 2 - 2k) 


F[k,(n\ + n 2 - 2 k)] 


(8.7.4) 


Chow mostrou que, sob a hipotese nula, as regressoes (8.7.1) e (8.7.2) sao (estatisticamente) iguais 
(nao ha mudan 5 a ou quebra estrutural) e a razao F anterior segue a distribu^ao F com k e(n t + n 2 — 2k) 
graus de liberdade no numerador e no denominador, respectivamente. 

6 . Portanto, nao rejeitaremos a hipotese nula de estabilidade dos parametros (ausencia de mudan- 
5 a estrutural) se o valor de F calculado em uma aplica^'ao nao for superior ao valor de F crftico regis- 
trado na tabela F no nivel de significance (ou valor p) escolhido. Nesse caso, o uso da regressao 
combinada (restrita?) (8.7.3) pode ser justificado. Contrariamente, se o valor de F calculado for supe¬ 
rior ao valor de F crftico, rejeitaremos a hipotese de estabilidade dos parametros e concluiremos que 
as regressoes (8.7.1) e (8.7.2) sao diferentes e, desse modo, o emprego da regressao combinada 
(8.7.3) seria, no mfnimo, de valor dubio. 

Voltando ao nosso exemplo, verificamos que: 


_ (23.248,30- 11.790,252)/2 

(11.790,252)/22 

= 10,69 


(8.7.5) 


Na tabela F, descobrimos que, com 2 e 22 graus de liberdade, o valor crftico de F para um nfvel 
de significance de 1% e igual a 5,72. A probabilidade de obter um valor F igual ou maior que 10,69 
e muito menor que 1%; na realidade, o valor p e de apenas 0,00057. 

O teste de Chow, portanto, parece apoiar a nossa ideia inicial de que a rela 9 ao entre a poupan?a e a 
renda nos Estados Unidos sofreu uma mudanca estrutural ao longo do perfodo 1970-1995, supondo 
que as hipoteses que embasam o teste estejam validas. Em breve, falaremos mais sobre esse assunto. 

Observe, a proposito, que o teste de Chow pode ser facilmente generalizado para lidar com casos 
em que ha mais de uma quebra estrutural. Por exemplo, se acreditamos que a rela 5 ao poupan 5 a-renda 
mudou depois da posse do presidente Clinton em janeiro de 1992, podemos dividir a amostra em tres 
subperfodos: 1970-1981; 1982-1991; 1992-1995 e aplicar o teste de Chow. 
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Modelos de regressao com equagao unica 


Obviamente, teriamos quatro termos SQR, um para cada periodo e um para os dados combinados, 
mas a logica do teste permanece a mesma. Hoje, os dados disponfveis ja chegam a 2007, de modo que 
o ultimo subperfodo poderia ser estendido. 


Ha algumas ressalvas sobre o teste de Chow que devem ser lembradas: 


1. As hipoteses que embasam o teste devem estar validas. Por exemplo, e preciso verificar se as 
variancias dos erros das regressoes (8.7.1) e (8.7.2) sao as mesmas. Discutiremos este ponto em breve. 

2. O teste de Chow apenas indicara se as duas regressoes (8.7.1) e (8.7.2) sao diferentes, sem in- 
formar se a diferenga e por conta dos interceptos, dos coeficientes angulares ou de ambos. No Capi- 
tulo 9, sobre variaveis binarias, veremos como podemos responder a questao. 

3. O teste de Chow pressupoe que conhecemos o(s) ponto(s) de quebra estrutural. No exemplo, 
presumimos que ela seria em 1982. Se nao for possfvel determinar o momento em que realmente 
aconteceu a mudanca estrutural, talvez tenhamos de usar outros metodos. 16 

Antes de deixarmos o teste de Chow e a regressao poupanga-renda, examinaremos uma das hipo¬ 
teses que embasam o teste de Chow, a de que as variancias dos erros sao iguais nos dois perfodos. 
Como nao podemos observar as verdadeiras variancias dos erros nos dois perfodos, obtemos suas 
estimativas por meio das SQR das regressoes (8.7.1a) e (8.7.2a), a saber: 


a 


2 

1 


SQR, 

n\ - 2 


1785,032 

io 


178,5032 


(8.7.6) 


07 


sqr 2 

«2 — 2 


10.005,22 

14-2 


833,7683 


(8.7.7) 


Observe que, uma vez que existem dois parametros estimados em cada equagao, subtraimos 2 do 
numero de observagdes para obter os graus de liberdade. Dadas as hipoteses subjacentes ao teste de 
Chow, a\ e cr\ sao estimadores nao viesados das verdadeiras variancias dos dois subperfodos. Como 
resultado, podemos demonstrar que, se oq = a\, ou seja, as variancias das duas subpopulagoes sao 
iguais (como pressupoe o teste de Chow), entao podemos demonstrar que 


(^i 2 / g i 2 ) 

(-2V-2 2 ) 


F(ni-k),(n 2 -k) 


(8.7.8) 


segue a distribuigao F com (n 1 — k) e (n 2 — k) graus de liberdade no numerador e no denominador, 
respectivamente; em nosso exemplo, k = 2, visto que existem apenas dois parametros em cada 
sub-regressao. 

Obviamente, se oq = a\ o teste de F anterior reduz-se ao calculo de: 

F = 4 (8.7.9) 

«2 

/Voto: por convengao, colocamos a maior das duas variancias estimadas no numerador. (Veja no 
Apendice A os detalhes de F e outras distribuigoes de probabilidade.) 

Calculando esses F em uma aplicagao e comparando-os ao valor crftico de F com os graus de li¬ 
berdade apropriados, podemos decidir rejeitar ou nao a hipotese nula de que as variancias das duas 
subpopulagoes sao iguais. Se a hipotese nula nao for rejeitada, poderemos usar o teste de Chow. 
Voltando a regressao poupanga-renda, obtemos o seguinte resultado: 


833,7683 

178,5032 


4,6701 


(8.7.10) 


16 


Em GREENE, William H. Econometric analysis. 4. ed. Englewood Cliffs, N.J.: Prentice Hall, 2000, p. 293-297, 
encontra-se um exame detalhado da questao. 
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Sob a hipotese nula de igualdade das variancias das duas subpopulagoes, esse valor de F segue a 
distribuigao F com 12 e 10 graus de liberdade no numerador e denominador, respectivamente. ( Nota: 
colocamos a maior das duas variancias estimadas no numerador). Vemos, nas tabelas de Fdo Apen- 
dice D, que os valores crfticos de F a 5% e 1%, com 12 e 10 graus de liberdade, respectivamente, sao 
2,91 e 4,71. O valor de F calculado e significativo ao nivel de 5% e quase significativo ao nivel de 
1%. Podemos concluir que as variancias das duas subpopulagoes nao sao as mesmas e, na realidade, 
nao deverfamos aplicar o teste de Chow. 

Nosso proposito aqui foi o de demonstrar a mecanica do teste de Chow, muito usado em trabalhos 
aplicados. Se as variancias dos erros das duas subpopulagoes forem heterocedasticas, o teste de Chow 
podera ser modificado. Mas esse procedimento esta alem do escopo deste livro. 17 

Outro ponto que mencionamos anteriormente foi o de que o teste de Chow e sensivel a escolha do 
perfodo em que os parametros de regressao podem ter registrado a mudanga. No exemplo, presumi- 
mos que a mudanga provavelmente ocorreu no ano de recessao, 1982. Se tivessemos suposto que se 
trata de 1981, quando Ronald Reagan assumiu a Presidencia, o valor calculado de F poderia ser dife- 
rente. Como, alias, no Exercicio 8.34, o leitor sera convidado a verificar isso. 

Se nao quisermos escolher o ponto em que a quebra da relagao subjacente ocorreu, podemos re- 
correr a metodos alternatives, como o teste residual recursivo. Retomaremos a questao no Capftulo 
13, que trata a analise de especificagao do modelo. 


8.8 Previsao com regressao multipla 

Na Segao 5.10, mostramos como o modelo de regressao com duas variaveis pode ser usado 
para (1) fazer previsoes medias, ou seja, prever o ponto na fungao de regressao populacional 
(FRP), bem como para (2) previsoes individuais, ou seja, prever um valor individual de Y dado o 
valor do regressor X — X 0 , em que X 0 eo valor numerico especificado de X. 

A regressao multipla estimada tambem pode ser usada para propositos semelhantes e o proce¬ 
dimento para tal e uma extensao direta do caso de duas variaveis, exceto que as formulas para 
estimar as variancias e os erros padrao do valor previsto (comparaveis as Equagoes (5.10.2) e 
(5.10.6) do modelo de duas variaveis) sao muito complicadas e melhor tratadas pelos metodos 
matriciais examinados no Apendice C. Com certeza, a maioria dos programas de regressao pode 
fazer isso rotineiramente, entao nao e necessario procurar a formulagao matricial. Ela e apresen- 
tada no Apendice C beneficiando os estudantes com inclinagoes matematicas; nele encontramos, 
tambem, um exemplo plenamente elaborado. 


8.9 A trinca dos testes de hipotese: a razao de verossimilhan^a (RV), 
o teste de Wald (W) e o multiplicador de Lagrange (ML) 18 

Neste e no capftulo anterior, empregamos de modo geral os teste t,Fe qui-quadrado para testar varias 
hipoteses no contexto de modelos de regressao lineares (nos parametros). Mas, uma vez que vamos alem 
do mundo confortavel dos modelos de regressao linear, precisamos de metodos para testar hipoteses que 
possam tratar modelos de regressao lineares ou nao. 

A conhecida trindade dos testes de verossimilhanga, de Wald e do multiplicador de Lagrange 
pode cumprir esse objetivo. O interessante e observar que assintoticamente (no caso de amostras 


17 Um exame do teste de Chow sob condigoes de heterocedasticidade e encontrado em GREENE, William H. 
Econometric analysis. 4. ed. Englewood Cliffs, N.J.: Prentice Hall, 2000, p. 292-293, e em DARNELL, Adrian C. 
A dictionary of econometrics. Reino Unido: Edward Elgar, 1994, p. 51. 

*Opcionais. 

18 Uma apresentagao acessfvel pode ser encontrada em BUSE, A. "The likelihood ratio, Wald and Langrange 
multiplier tests: an expository note." American Statistician, 1982. v. 36, p. 153-157. 
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grandes) todos os tres sao equivalentes e que o teste estatlstico associado a cada um deles segue a 
distribuigao de qui-quadrado. 

Embora examinemos o teste de verossimilhanca no apendice deste capltulo, de modo geral nao 
empregamos esses testes neste livro pela simples razao de que, em amostras pequenas ou finitas, que 
infelizmente sao aquelas com que lida a maioria dos pesquisadores, o teste F que utilizamos ate aqui 
sera suficiente. Como Davidson e MacKinnon observam: 

No caso de modelos de regressao linear, com e sem erros normais, nao ha a necessidade de examinar- 
mos a razao de verossimilhanga (RV), o teste de Wald (W) e o multiplicador de Lagrange (ML), ja que 
nao nos proporcionam informagoes maiores do que as ja presentes em F. 19 


8.10 Teste da forma funcional da regressao: escolha entre modelos 
de regressao lineares e log-lineares 

A escolha entre um modelo de regressao linear (o regressando e uma fungao linear dos regresso- 
res) ou um modelo log-linear (o logaritmo do regressando e uma fungao dos logaritmos dos regres- 
sores) e um dilema perpetuo da analise empmca. Podemos recorrer a um teste proposto por 
MacKinnon, White e Davidson, que chamaremos, para abreviar, teste MWD, para a escolha entre 
dois modelos. 20 

Para ilustrar esse teste, imaginemos o seguinte: 

H 0 : modelo linear. Y e uma fungao linear dos regressores, os X. 

H x \ modelo log-linear. In Y e uma fungao linear dos regressores, os logaritmos dos X. 

em que, como de costume, H 0 e //, denotam as hipoteses nula e alternativa. 

O teste MWD envoive as seguintes etapas: 21 

Etapa I: estimagao do modelo linear e obtengao dos valores estimados de Y. que chamaremos 
de y/(ou seja Y); 

Etapa II: estimagao do modelo log-linear e obtengao dos valores estimados de In Y, que 
chamaremos de ln/(ou seja, lnfj; 

Etapa III: calculo de Z l — (In Yf - In/); 

Etapa IV: regressao de Y contra X e o Z x obtido na Etapa III. Rejeita-se H 0 se o coeficiente 
de Z| e estatisticamente significativo segundo o teste t habitual; 

Etapa V: calculo de Z 2 = (antilogaritmo de In/— Y f)\ 

Etapa VI: regressao do logaritmo de Y contra os logaritmos dos X e Z 2 . Rejeita-se //, se o 
coeficiente de Z 2 e estatisticamente significativo segundo o teste t habitual. 

Embora o teste MWD parega complicado, sua logica e bastante simples. Se o modelo linear for de 
fato o modelo correto, a variavel construi'da Z, nao deve ser estatisticamente significativa na Etapa IV, 
pois nesse caso os valores estimados de Y com base no modelo linear e aqueles estimados com base 


19 DAVIDSON, Russel; MACKINNON, James G. Estimation and inference in econometrics. Nova York: Oxford Univer¬ 
sity Press, 1993. p. 456. 

*Opcionais. 

20 Mackinnon,WHITE, H.; DAVIDSON, R. "Tests for model specification in the presence of alternative hypothe¬ 
sis: some further results." lournal of Econometrics, v. 21, p. 53-70, 1983. Um teste semelhante e proposto em 
BERA, A. K.; JARQUE, C. M. "Model specification tests: a simultaneous approach." lournal of Econometrics, v. 20, 
p. 59-82, 1982. 

21 Esta apresentagao embasa-se em GREENE, William H. ET. the econometrics toolkit version 3. Econometrics Software. 
Nova York: Bellport, 1992. p. 245-246. 
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no modelo log-linear (depois de obtidos seus antilogaritmos para fins de comparaqiao) nao devem ser 
diferentes. 0 mesmo comentario aplica-se a hipotese alternativa //,. 

EXEMPLO 8.5 

A demanda por 

rosas 

Voltemos ao Exercfcio 7.16, em que apresentamos dados relativos a demanda por rosas 
na area metropolitana de Detroit no perfodo que vai do segundo trimestre de 1971 ao se- 
gundo trimestre de 1975. Para fins de ilustragao, consideraremos que a demanda por rosas 
seja fun^ao apenas dos pre^os das rosas e dos pre^os dos cravos, deixando de lado, por en- 
quanto, a variavel renda. Agora vejamos os seguintes modelos: 

Modelo linear: Y t = ai + a 2 X 2 t + a 3 X 3t + u t (8.10.1) 

Modelo log-linear: InV^ p-\ + fo In X 2 t + fii\nX it + u t (8.10.2) 

em que Ye a quantidade de rosas, em duzias, X 2 e o prego medio das rosas no atacado, em 

$/duzia, e X 3 e o prefo medio dos cravos no atacado, em $/ duzia. A priori, espera-se que 

a 2 e p 2 se i a negativo e /J 3 e j0 3 seja positivo (por que?). Como sabemos, os coeficientes 
angulares no modelo log-linear dao as elasticidades. 

Os resultados da regressao sao os seguintes: 

Yt = 9734,21 76 - 3782,1956X 2f + 2815,2515X 3f 

t= (3,3705) (-6,6069) (2,9712) 

F = 21,84 R 2 = 0,77096 (8.10.3) 

IrTv't = 9,2278 - 1,7607 lnX 2t + 1,3398 lnX 3f 

t= (16,2349) (-5,9044) (2,5407) (8.10.4) 

F= 17,50 R 2 = 0,7292 

Como os resultados mostram, os dois modelos parecem ajustar-se muito bem aos dados: os 
parametros apresentam os sinais esperados e os valores de t e de R 2 sao estatisticamente 
significativos. 

Para escolhermos um desses modelos com base no teste MWD, primeiro testamos a 
hipotese de que o verdadeiro modelo e o linear. De acordo com a Etapa IV do teste, calcula- 
mos a seguinte regressao: 

Y t = 9727,5685 - 3783,0623X 2( + 281 7,7157X 3t + 85,2319Z lt 

t= (3,2178) (-6,3337) (2,8366) (0,0207) (8.10.5) 

F= 13,44 R 2 = 0,7707 

Como o coeficiente de Z 3 nao e estatisticamente significativo (o valor p do f estimado e 0,98), 
nao rejeitamos a hipotese de que o verdadeiro modelo seja linear. 

Suponha, agora, que mudemos de opiniao e consideremos que o verdadeiro modelo seja 
o log-linear. De acordo com a Etapa VI do teste MWD, obtemos os seguintes resultados da 
regressao: 

lrT? f = 9,1486 - 1,9699lnX t + 1,5891 In X 2t - 0,001 3Z 2t 

t= (17,0825) (-6,4189) (3,0728) (-1,6612) (8.10.6) 

F= 14,17 R 2 = 0,7798 

O coeficiente de Z 2 e estatisticamente significativo a cerca de 12% (valor p igual a 0,1225). 
Portanto, podemos rejeitar a hipotese de que o verdadeiro modelo seja o log-linear neste 
nfvel de significancia. Obviamente, se mantivermos os nfveis de significancia convencionais, 
de 1 % ou 5%, nao poderemos rejeitar a hipotese de que o verdadeiro modelo seja log-linear. 
Como este exemplo mostra, e bem possfvel que, em certas situates, nao possamos rejeitar 
nenhuma das especificagoes. 
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Resumo e 
Conclusoes 


EXERCICIOS 


1. Este capitulo estendeu e refinou as ideias de estimagao de intervalos e teste de hipoteses 
apresentadas inicialmente no Capitulo 5, no contexto de um modelo de regressao com duas 
variaveis. 

2. Em uma regressao multipla, o teste da significancia individual de um coeficiente parcial de 
regressao (utilizando o teste t ) e o teste de significancia geral da regressao (isto e, H 0 \ todos 
os coeficientes parciais angulares sao zero ou R 2 = 0) nao sao a mesma coisa. 

3. Em especial, a verificaqao de que um ou mais coeficientes parciais de regressao sao nao 
significativos estatisticamente com base no teste t individual nao indica que todos os coefi¬ 
cientes parciais de regressao tambem sejam (coletivamente) nao significativos estatistica¬ 
mente. Essa hipotese so pode ser testada com auxflio do teste F. 

4. O teste F e versatil no sentido de que pode testar uma grande variedade de hipoteses, como 
verificar se (1) um coeficiente individual de regressao e estatisticamente significativo; (2) 
todos os coeficientes parciais angulares sao iguais a zero; (3) dois ou mais coeficientes sao 
estatisticamente iguais; (4) os coeficientes satisfazem alguma restrigao linear; e (5) o modelo 
de regressao apresenta estabilidade estrutural. 

5. Como no caso de duas variaveis, o modelo de regressao multipla pode ser usado para fins de 
previsao media e/ ou individual. 


8.1. Imagine que voce deseja estudar o comportamento das vendas de um produto, por exemplo, 
automoveis, ao longo de alguns anos e suponha que alguem lhe sugira testar os seguintes mo¬ 
delos: 

Y t = fio + P\ t 

Yf = (Xq + Oi\t + CLjt 2 

em que Y, — vendas no ano e t — tempo, medido em anos. O primeiro modelo postula que as 
vendas sao uma tuncao linear do tempo, enquanto o segundo considera que sejam uma funciao 
quadratica do tempo. 

a. Discuta as propriedades desses modelos. 

b. Como voce decidiria entre os dois modelos? 

c. Em que situaqoes o modelo quadratico seria util? 

d. Procure dados sobre as vendas de automoveis nos Estados Unidos nos ultimos 20 anos e 
verifique qual dos modelos ajusta-se melhor aos dados. 

8.2. Demonstre que a razao F da Equa§ao (8.4.16) e igual a razao F da Equaciao (8.4.18). ( Dica: 
SQE/SQT = R 2 .) 

8.3. Mostre que os testes F das Equa 5 oes (8.4.18) e (8.6.10) sao equivalentes. 

8.4. Estabeleqa as afirma 9 oes (8.6.11) e (8.6.12). 

8.5. Considere a tuncao de prod 119 ao Cobb-Douglas 

Y = (1) 

em que Y = produto, L = insumo trabalho e K — insumo capital. Dividindo (1) por K, 
obtemos: 


(Y/K) = 


(2) 
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Tomando o logaritmo natural de (2) e acrescentando o termo de erro, obtemos: 

In (Y/K) - ft + @2 In(L/K) + (ft + ft - 1) In K + w, (3) 


em que ft = In ft 

a. Imagine que voce tenha os dados para calcular a regressao (3). Como testaria a hipotese de 
retornos constantes de escala, isto e, (ft + ft) =1? 

b. Se os retornos de escala forem constantes, como voce interpretara a regressao (3)? 

c. Faz diferen£a dividir (1) por L no lugar de K‘! 

8.6. Valores criticos de R 2 quando o verdadeiro R 2 — 0 . A Equa£ao (8.4.11) fomece a relagao entre F 
e R 2 sob a hipotese de que todos os coeficientes parciais angulares sao simultaneamente iguais a 
zero (isto e, R 2 = 0). Do mesmo modo que podemos encontrar o valor crftico de F no nrvel de sig¬ 
nificance a na tabela F, podemos encontrar o valor crftico de R 2 por meio da seguinte rela§ao: 


R 2 


(*~ 1 )^ 

(k - 1 )F+ (n - k) 


em que k € o ntimero de parametros do modelo de regressao, incluindo o intercepto, e F e o 
valor crftico de F no nivel de significance a. Se o R 2 observado exceder o R 2 crftico obtido por 
meio da formula anterior, poderemos rejeitar a hipotese de que o verdadeiro R 2 seja zero. 

Demonstre a formula anterior e encontre o valor crftico de R 2 para a = 5% no caso da re¬ 
gressao (8.1.4). 

8.7. Os resultados abaixo correspondem a uma regressao calculada com dados anuais do periodo 
1968-1987: 

Y,=- 859,92 + 0,6470ft, - 23,195ft, R 2 = 0,9776 (1) 

Y,=- 261,09 + 0,2452ft,, R 2 = 0,9388 (2) 

em que Y — gastos dos Estados Unidos com importapao de bens, em bilhoes de $ de 1982; X 2 — 
renda pessoal disponivel, em bilhoes de $ de 1982; e X 2 — variavel de tendencia. 

Verdadeiro oufalso: o erro padrao de ft em (1) e 4,2750. Mostre seus calculos. ( Dica: recorra 
a rela 5 ao entre /ft F e t .) 

8.8. Imagine que na regressao 

In (Yi / X 2 i) — a 1 + ^lnft, + a3lnft, + m,- 

os valores dos coeficientes de regressao e seus erros padrao sao conhecidos. Sabendo isso, como 
poderiamos estimar os parametros e os erros padrao do seguinte modelo de regressao? 22 

In Yj = Pi + ft In ft, + ft In ft, + w, 

8.9. Suponha que: 


Y, - ft + p 2 X 2 i + ft ft, + ftftift, + m, 

em que Y sao as despesas pessoais de consumo, ft e a renda pessoal e ft e a riqueza pessoal. 1 
O termo (ft, ft,) e conhecido como termo de intera^ao. O que queremos dizer com essa 


* Adaptado de KENNEDY, Peter. A guide to econometrics. 3. ed. Cambridge, Mass: The MIT Press, 1992. p.310. 
t Ibid., p. 327. 
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expressao? Como seria possivel testar a hipotese de que a propensao marginal a consumir 
(PMC), isto e, /T, e independente da riqueza do consumidor? 

8.10. Dados os seguintes resultados de uma regressao: 


Y t = 

16.899 

- 2978, 5X 2 , 


R 2 = 0,6149 

t = 

Y, = 

(8,5152) 

9734,2 

(- 4,7280) 

- 3782, 2X lt + 

2815A 3( 

R 2 = 0,7706 

t = 

(3,3705) 

(- 6,6070) 

(2,9712) 



E possivel descobrir qual o tamanho da amostra que gerou esses resultados? ( Dica: lembre-se 

da relagao entre os valores de R 2 , F e t.) 

8.11. Com base no que dissemos sobre o uso dos testes 1 e F para testar hipoteses, individual e con- 

juntamente, quais das seguintes situapoes seriam possiveis? 

1. Rejeigao da hipotese nula com base na estatlstica F, sem, contudo, rejeitar cada hipotese 
nula isolada com base no teste 1 individual. 

2. Rejeitar a hipotese nula conjunta com base na estatlstica F, rejeitar uma hipotese indivi¬ 
dual com base no teste 1 e nao rejeitar as demais hipoteses individuals com base no mesmo 
teste t. 

3. Rejeitar a hipotese nula conjunta com base na estatlstica F, rejeitar uma das hipoteses indi¬ 
vidual com base nos testes t individuais. 

4. Nao rejeitar a hipotese nula conjunta com base na estatlstica F, rejeitar uma das hipoteses 
nulas individuais com base nos testes t. 

5. Nao rejeitar a hipotese nula conjunta com base na estatlstica F, rejeitar uma das hipoteses 
individuais com base no teste t e nao rejeitar as demais com base no mesmo teste. 

6. Nao rejeitar a hipotese nula conjunta com base na estatlstica F, mas rejeitar todas as hipo¬ 
teses nulas individuais com base nos testes t. 

Exercfcios aplicados 

8.12. Voltemos ao Exercicio 7.21. 

a. Quais as elasticidades renda real e taxa de juros dos saldos monetarios reais? 

b. Essas estatisticas tem, individualmente, significancia estatlstica? 

c. Teste a significancia geral da regressao estimada. 

d. A elasticidade renda da demanda por saldos monetarios reais e significativamente diferen- 
te da unidade? 

e. A variavel “taxa de juros” deveria permanecer no modelo? Por que? 

8.13. Com dados relativos a 46 Estados dos Estados Unidos para o ano de 1992, Baltagi obteve os 

seguintes resultados de uma regressao: 1 ' 

logC = 4,30 - 1,34 log P + 0,17 log Y 

ep = (0,91) (0,32) (0,20) R 2 = 0,27 

em que C — consumo de cigarros, em mafos/ano 
P — preco real do ma 50 
Y — renda real disponlvel per capita 

* Extrafdo de BERNDT, Ernst R. The pratice of econometrics: classic and contemporary. Reading, Mass.: Addison-Wesley, 
1991. p. 79. 

t Veja BALTAGI, Badi H. Econometrics. Nova York: Springer-Verlag, 1998.. p.111. 
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a. 


Qual a elasticidade-prego da demanda por cigarros em relagao ao prego? E estatistica- 


mente significativa? E estatisticamente diferente de 1? 

b. Qual a elasticidade-prego da demanda por cigarros? E estatisticamente significativa? Se 
nao for, qual seria(m) a(s) razao(oes)? 


Como poderfamos obter R 1 com base no R 2 ajustado acima? 


c. 


8.14. Com base uma amostra de 209 empresas, Wooldridge obteve os seguintes resultados de 


regressao: 



vendas = vendas anuais da empresa 

roe = retomo sobre o patrimonio, em % 
ros = retorno sobre as agoes da empresa 
e os numeros entre parenteses sao os erros padrao estimados. 

a. Interprete a regressao anterior levando em conta quaisquer expectativas a priori que voce 
poderia ter sobre os sinais dos varios coeficientes. 

b. Qual dos coeficientes e, individualmente, significativo do ponto de vista estatistico no nivel 


de 5%? 


c. Qual a significance geral da regressao? Que testes voce aplicou? Por que? 

d. Poderiamos interpretar os coeficientes de roe e ros como coeficientes de elasticidade? Jus- 
tifique sua resposta. 

8.15. Supondo que Y e X 2 , X 2 ,.... X k apresentem, em conjunto, distribuigao normal e que a hipotese 
nula seja a de que as correlagoes parciais da populagao sejam individualmente iguais a zero, R. 
A. Fisher demonstrou que 


r\ 2 , 34 ...k \Jn- k - 2 


t = 



segue a distribuigao t com n — k — 2 graus de liberdade, em que k 6 o fc-esimo coeficiente de 
correlagao parcial e n e o numero total de observagoes. ( Nota: r 12 3 e iim coeficiente de correlagao 
parcial de primeira ordem; r l2 34 e um coeficiente de correlagao parcial de segunda ordem e as- 
sim por diante.) Voltemos ao Exercicio 7.2. Supondo que Y, X 2 e X 2 registrem conjuntamente 
uma distribuigao normal, calcule as tres correlagoes parciais r 12j 3, r 13 2 e r 23 , e teste sua signifi¬ 
cancia na hipotese de que as correlagoes populacionais correspondentes sao, individualmente, 
iguais a zero. 

8.16. Ao estudar a demanda de tratores agricolas dos Estados Unidos, nos perfodos 1921-1941 e 
1948-1957, Griliches 1 ' obteve os seguintes resultados: 


log7, = constante - 0,5191ogA 2r - 4,933 log X 2t R 2 = 0,793 
(0,231) (0,477) 


* See Jeffrey M. Wooldridge, Introductory Econometrics, South-Western Publishing Co., 2000, pp. 154-155. 
t GRILICHES, Z. "The demand for a durable input: farm tractors in the United States, 1921 -1957." In: HARBERGER, 
Arnold C. (Ed.). The demand for durable goods. Chicago: The University of Chicago Press, 1960. p. 192. tabela 1. 
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em que Y t — valor do estoque de tratores existentes nos estabelecimentos agricolas em 1° de janeiro, 
em dolares de 1935-39; X 2 — mdice de precos dos tratores dividido por um Indice dos precos rece- 
bidos por todos os produtos agricolas no perfodo t — 1; X 2 — taxa de juros vigente no ano t — 1. Os 
numeros entre parenteses sao os erros padrao. 

a. Interprete a regressao anterior. 

b. Os coeficientes angulares estimados apresentam, individualmente, significancia estatisti- 
ca? Sao significativamente diferentes de 1? 

c. Aplique a tecnica de analise de variancia para testar a significancia da regressao geral. 
Diccr. use a variante R 2 da tecnica ANOVA. 

d. Como seria possivel calcular a elasticidade da demanda por tratores agricolas em relagao a 
taxa de juros? 

e. Como seria possivel testar a significancia do R 2 estimado? 

8.17. Considere a seguinte equagao de determinagao dos salarios para a economia britanica* no 
periodo 1950-1969: 

W t = 8,582 + 0,364(PF) ( + 0,004(PF),_, - 2,560C, 

(1,129) (0,080) (0,072) (0,658) 

R 2 = 0,873 gl = 15 

em que W — salarios e ordenados por funcionario 

PF = precos do produto final a custo de fatores 

U = taxa de desemprego na Gra-Bretanha, em % do total de empregados do pais 
t = anos 

(Os numeros entre parenteses sao os erros-padrao estimados.) 

a. Interprete a regressao acima. 

b. Os coeficientes estimados sao, individualmente, significativos? 

c. Qual e a logica do uso da variavel (PF) r „ 1 ? 

d. A variavel (PF) t _\ deveria ser excluida do modelo? Por que? 

e. Como poderfamos calcular a elasticidade dos salarios e ordenados por funcionario em re- 
laijao a taxa de desemprego, U ? 

8.18. A equayao a seguir e uma variante daquela dada no Exercfcio 8.17:* 

W t = 1,073 + 5,2881) - 0,116A,+ 0,054M ( + 0,046M r _, 

(0,797) (0,812) (0,111) (0,022) (0,019) 

R 2 = 0,934 gl = 14 

em que W — salarios e ordenados por funcionario 

V — vagas abertas na Gra-Bretanha como percentual do numero de empregados do pals 
X — produto interno bruto por pessoa empregada 
M — pre 50 das importa 5 oes 

M t _ | = pregos das importagoes no ano anterior (ou defasado) 

(Os numeros entre parenteses sao os erros padrao estimados.) 
a. Interprete a equagao acima. 

* Extrafdo de Prices and earnings in 1951-1969: an econometric assessment. Dept, of Employment, HMSO, Equa¬ 
gao (19), 1971. p. 35. 
t Ibid, Equagao (67), p. 37. 
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b. Quais dos coeficientes estimados sao, do ponto de vista estatistico, individualmente signi- 
ficativos? 

c. Qual e a logica da inclusao da variavel XI A priori, seria de esperar que seu sinal fosse 
negativo? 

d. Qual o objetivo da inclusao de M, e M t _ no modelo? 

e. Qual das variaveis poderia ser excluida do modelo? Por que? 

f. Teste a significance geral da regressao observada. 

8.19. No caso da fungao de demanda por carne de frango estimada na Equagao (8.6.24), a elastici- 
dade renda estimada e igual a 1? A elasticidade prego e igual a — 1? 

8.20. No caso da fungao de demanda na Equagao (8.6.24), como seria possrvel testar a hipotese de 
que o valor da elasticidade renda e igual ao da elasticidade prego, mas seus sinais sao contra- 
rios? Mostre os calculos necessarios. ( Nota: cov [P 2 , P 2 ] — —0,00142.) 

8.21. Volte a fungao de demanda por rosas do Exercicio 7.16 e restrinja suas consideragdes a especifi- 
cagao logaritmica. 

a. Qual a elasticidade prego propria estimada (isto e, a elasticidade com respeito ao prcco das 
rosas)? 

b. E estatisticamente significativa? 

c. Em caso positivo, e significativamente diferente da unidade? 

d. A priori, quais seriam os sinais esperados de X 2 (prego dos cravos) e X 4 (renda)? Os resul- 
tados empiricos estao de acordo com essas expectativas? 

e. Se os coeficientes de X 2 e X 4 forem nao significativos estatisticamente, quais poderiam ser 
as razoes disso? 

8.22. Volte ao Exercicio 7.17 que trata das atividades de prospecpao de petroleo. 

a. Cada um dos coeficientes angulares estimados e estatisticamente significativo no nivel de 5%? 

b. Voce rejeitaria a hipotese de que R 2 — 0? 

c. Qual a taxa de crescimento instantanea das atividades de prospec§ao de petroleo no perfo- 
do 1948-1978? E a taxa de crescimento geometrica no mesmo periodo? 

8.23. Volte a regressao dos gastos militares dos Estados Unidos, estimada no Exercicio 7.18. 

a. Comente os resultados gerais da regressao estimada. 

b. Monte uma tabela ANOVA e teste a hipotese de que todos os coeficientes parciais angula¬ 
res sao iguais a zero. 

8.24. A fun§ao a seguir e conhecida como funcao de producao transcendental ou translog (FPT), 
uma generaliza§ao da funcao de producao Cobb-Douglas: 

Yi = L h k^e^ L+ ^ K 

em que Y — produto, L = insumo trabalho e K — insumo capital. 

Depois de aplicar logaritmos e acrescentar um termo de erro estocastico, obtemos a FPT: 

In Y ; — Pq + P 2 In L : + p 2 In Kj + p 4 /,, + PsKj + u, 


em que /? 0 = In p x . 

a. Quais as propriedades dessa funcao? 

b. Para que a FTP reduza-se a uma fungao de produgao Cobb-Douglas, quais deveriam ser os 
valores de p 4 e /? 5 ? 

c. Se tivessemos os dados em maos, como poderiamos verificar se a FTP reduz-se a uma 
fungao de produgao Cobb-Douglas? Que procedimentos de teste deveriamos aplicar? 

d. Verifique se a FTP ajusta-se aos dados da Tabela 8.8. Mostre seus calculos. 
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8.25. Pregos da energia e formagao de capital : Estados Unidos, 1948-1978. Para testar a hipotese 
de que um aumento nos pregos da energia em relagao ao produto provoca uma queda de pro- 
dutividade dos recursos de capital e trabalho existentes, John A. Tatom estimou a seguinte 
fungao de produgao para os Estados Unidos no perfodo que vai do primeiro trimestre de 1948 
ao segundo trimestre de 1978: 

\n\y/P) = 1,5492 + 0,7135 ln(/z/Ar) - 0,1081 In (P e /P) 

(16,33) (21,69) (-6,42) 

+ 0,0045t R 1 = 0,98 

(15,86) 

em que y — produgao real do setor privado 

k — indicador do fluxo de servi 90 s de capital 
h — horas/homens trabalhadas no setor privado 

P e — fndice de pregos ao produtor para combustrveis e produtos correlatos 
P — deflator de pregos para o setor privado 
t — tempo (em trimestres) 

Os numeros entre parenteses sao as estatisticas t. 

a. Os resultados confirmam a hipotese do autor? 

b. Entre 1972 e 1977, o prego relativo da energia, ( P e /P ), aumentou 60%. Com base na re¬ 
gressao estimada, qual foi a perda de produtividade? 

c. Depois de levar em conta as alteragoes de (hlk) e (P,,/P), qual foi a taxa de crescimento 
tendencial da produtividade durante o periodo de amostragem? 

d. Como voce interpretaria o valor de 0,7135 para o coeficiente? 

e. O fato de que cada um dos coeficientes angulares parciais e estatisticamente significativo 
(por que?) quer dizer que podemos rejeitar a hipotese R 2 — 0? Justifique sua resposta. 

8.26. A demanda por cabos. A Tabela 8.10 fornece dados usados por um fabricante de cabos telefo- 
nicos para prever as vendas a um de seus principais clientes no periodo 1968-1983. 1 

As variaveis do quadro sao assim definidas: 

Y — vendas anuais em milhoes de pes de pares (MPP) 

X 2 — produto nacional bruto (PNB), em bilhoes de $ 

X 2 — construgao de moradias, milhares de unidades 
X 4 — taxa de desemprego, % 

X 5 — taxa de juros preferencial com defasagem de 6 meses 
X 6 — ganhos de clientes por linha, %. 

Considere o seguinte modelo: 

Yi = Pi + PiXit + PiXn + p 4 X 4t + P5X5 1 + P(,Xfy + u t 

a. Estime a regressao acima. 

b. Quais os sinais esperados para os coeficientes deste modelo? 

c. Os resultados empiricos estao de acordo com as expectativas? 

d. Os coeficientes parciais estimados sao, do ponto de vista estatistico, individualmente signi- 
ficativos no nivel de 5%? 


* Veja deste autor, "Energy Prices and Capital Formation: 1972-1977". Review, Federal Reserve Bank of St. Louis, v. 
61, n. 5, p. 4, 5 de maio 1979. 

+ Agradego a Daniel J. Reardon pela coieta e processamento de dados. 
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TABELA 8.10 Variaveis da regressao 




Xj, 

*4, 

*5, 

*6, 

Y, 


*2, 

Construgao de 

Desemprego, 

Taxa de juros. 

Ganhos de clientes 

Vendas 

Ano 

PNB 

moradias 

% 

6 meses 

por linha, % 

anuais (MPP) 

1968 

1051,8 

1503,6 

3,6 

5,8 

5,9 

5873 

1969 

1078,8 

1486,7 

3,5 

6,7 

4,5 

7852 

1970 

1075,3 

1434,8 

5,0 

8,4 

4,2 

8189 

1971 

1107,5 

2035,6 

6,0 

6,2 

4,2 

7497 

1972 

1171,1 

2360,8 

5,6 

5,4 

4,9 

8534 

1973 

1235,0 

2043,9 

4,9 

5,9 

5,0 

8688 

1974 

1217,8 

1331,9 

5,6 

9,4 

4,1 

7270 

1975 

1202,3 

1160,0 

8,5 

9,4 

3,4 

5020 

1976 

1271,0 

1535,0 

7,7 

7,2 

4,2 

6035 

1977 

1332,7 

1961,8 

7,0 

6,6 

4,5 

7425 

1978 

1399,2 

2009,3 

6,0 

7,6 

3,9 

9400 

1979 

1431,6 

1721,9 

6,0 

10,6 

4,4 

9350 

1980 

1480,7 

1298,0 

7,2 

14,9 

3,9 

6540 

1981 

1510,3 

1100,0 

7,6 

16,6 

3,1 

7675 

1982 

1492,2 

1039,0 

9,2 

17,5 

0,6 

7419 

1983 

1535,4 

1200,0 

8,8 

16,0 

1,5 

7923 


e. Suponha que voce primeiro faga apenas a regressao de Y contra X 2 , X 2 e X 4 e, entao, decida 
incluir as variaveis X 5 e X 6 . Como poderiamos verificar se vale a pena o acrescimo destas 
novas variaveis? Que teste poderia ser usado? Demonstre os calculos necessarios. 

8.27. Marc Nerlove estimou a seguinte fungao de custo para a geragao de energia eletrica: 

Y = AXPpf'PpP^u (1) 


em que Y — custo total de produgao 

X — produgao em quilowatts/hora 
P x — prego do trabalho 
1 3 2 — prego do capital 
P 3 = prego do combustfvel 
u — termo de erro 

Teoricamente, espera-se que a soma das elasticidades prego seja igual a unidade, ou seja, 
(a i + 0-2 + «3 >. Ao impor essa restrigao, a fungao anterior pode ser escrita como: 

(y/p 2 )= Ax^p^p.nPi/p^ru ( 2 ) 

Em outras palavras, (1) e uma fungao de custo sem restrigoes enquanto (2) e uma fungao res- 
trita. 

Com base em uma amostra de 29 empresas de tamanho medio e apos efetuar uma transforma- 
gao logaritmica, Nerlove obteve os seguintes resultados de regressao: 

In?, = - 4,93 + 

ep= (1,96) 

-0,26 lnP 2 + 

(0,29) 


0,94 In Xj + 0,31 In P x 
(0,11) (0,23) 

0,44 In P 3 

(0,07) SQR= 0,336 


NERLOVE, Marc. Returns to scale in eletric supply. In: CHRIST, Carl (Ed.). Measurement in economics. Palo Alto, 
Calif.: Stanford University Press, 1963. A notagao foi alterada. 
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In( Y/Pfa = - 6,55 + 0,91 lnX + 0,51 ln(Pi/P 3 ) + 0,09 In (P 2 /Pi) 

ep= (0,16) (0,11) (0,19) (0,16) SQR= 0,364 (4) 

a. Interprete as equa? 6 es (3) e (4). 

b. Como seria posslvel verificar se a restri?ao (cq + a 2 + a 3 ) e valida? Mostre seus calculos. 
8.28. Estimagao do modelo de fonnagao de pregos de ativos ( CAPM ). Na Se£ao 6.1, consideramos 

rapidamente esse modelo conhecido da teoria moderna do portfolio. Na analise empfrica, a sua 
estimativa e feita em duas etapas. 

Etapa I: (Regressao de serie temporal). Para cada um dos N tftulos inclufdos na amostra, 
calculamos a seguinte regressao: 

Rit — &i "h PiRmt + &it ( 1 ) 

em que R it e R mt sao as taxas de retorno do /-esimo tftulo e do portfolio de mercado (por exem- 
plo, do indice S&P 500) no ano f; /(, como ja mencionado, e o coeficiente beta ou coeficiente de 
volatilidade de mercado do /-esimo tftulo; e e it e o resfduo. Ao todo, sao N regressoes deste tipo, 
uma para cada tftulo, com o que temos N estimativas de /?,. 

Etapa II: (Regressao de corte transversal). Nesta etapa, calculamos a seguinte regressao 
para os N tftulos: 

Ri = Y\+ YiPi + ut (2) 

em que R , e a taxa media de retorno do tftulo / calculada para o perfodo coberto pela amostra 
da Etapa I; /l, e o coeficiente beta estimado na regressao da primeira etapa; c u, e o termo residual. 
Comparando a regressao (2) obtida na segunda etapa com a Equa§ao do CAPM ( 6 .1.2), escri- 
ta como 


ER, = r f + Pi (ER,„ - rf) ( 3 ) 

em que r f ea taxa de retorno livre de risco, vemos que y, e uma estimativa de rj■ ey 2 e uma 
estimativa de (ER,„ — yj), o premio de risco do mercado. 

Assim, ao testar empiricamente o CAPM, R, e ft, sao usados como estimadores de ER, e ft r 
respectivamente. Agora, se o CAPM for valido, estatisticamente, 

Yi = r f 

Y 2 = Rm ~ r f, o estimador de (ER m - ry) 

Considere, agora um modelo alternativo 

Ri = Y i + Y2 Pi + fas;, + Ui ( 4 ) 

em que s 2 ei e a variancia residual do /-esimo tftulo da regressao estimada na primeira etapa. 
Entao, se o CAPM for valido, fa nao deve ser significativamente diferente de zero. 

Para testar o modelo, Levy estimou as regressoes (2) e (4) usando uma amostra de 101 a 9 oes para 
o perfodo 1948-1968 e obteve os seguintes resultados:* 


LEVY, H. "Equilibrium in an imperfect market: a constraint on the number of securities in the portfolio." American 
Economic Review, set. 1978. v. 68, n. 4, p. 643-658. 
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Rj = 0,109 + 

0,037 Pi 


(0,009) 

(0,008) 

(2)' 

t = (12,0) 

(5,1) R 2 = 0,21 



Rj = 0,106 + 

0,0024/3, 

+ 0,20 l.sy; 


(0,008) 

(0,007) 

(0,038) 

(4)' 

t = (13,2) 

(3,3) 

(5,3) R 2 = 0,39 



a. Estes resultados confirmam o CAPM? 

b. Vale a pena acrescentar a variavel s 2 ei ao modelo? Justifique. 

c. Se o modelo CAPM for valido, y, em (2)’ deveria aproximar-se do valor medio da taxa li- 
vre de risco, ry O valor estimado e 10,9%. Isso parece uma estimativa razoavel da taxa de 
retorno livre de risco no periodo observado, 1948-1968? (Podemos considerar a taxa 
de retorno das letras do Tesouro dos Estados Unidos ou outro ativo comparativamente livre 
de risco.) 

d. Se o modelo CAPM for valido, o premio de risco de mercado (R m — ry) da Equac^ao (2)’ e 
de cerca de 3,7%. Se supusermos que rt€ 10,9%, isso implica que R m para o periodo da 
amostra e de cerca de 14,6%. Essa estimativa parece razoavel? 

e. O que podemos dizer sobre o CAPM em geral? 

29. Voltemos ao Exercicio 7.21c. Agora que temos em maos as ferramentas necessarias, que 
teste(s) deveria(m) ser usado(s) para escolher um dos modelos? Mostre os calculos necessa- 
rios. Vale observar que as variaveis dependentes dos dois modelos sao diferentes. 

30. Voltemos ao Exemplo 8.3. Empregue o teste t como apresentado na Equa§ao (8.6.4) para des- 
cobrir se a economia mexicana registrou retornos constantes de escala no periodo estudado. 

31. Voltemos ao exemplo da mortalidade infantil. Na regressao (7.6.2), estimamos a regressao da 
mortalidade infantil (MI) contra o PNB per capita (PNBpc) e a taxa de alfabetiza§ao feminina 
(TAF). Agora vamos ampliar esse modelo incluindo a taxa de fecundidade total (TFT). Os 
dados sobre essas variaveis constam da Tabela 6.4. Reproduzimos a seguir a regressao (7.6.2) 
e mostramos os resultados do modelo de regressao ampliado: 

1. CM, = 263,6416 - 0,0056 PNBpc, - 2,2316 TAF, (7 6 2) 

ep= (11,5932) (0,0019) (0,2099) R 2 = 0,7077 

2. CM, = 168,3067 - 0,0055 PNBpc, - 1,7680 TAF, + 12,8686 TFT, 

ep= (32,8916) (0,0018) (0,2480) (?) 

R 1 = 0,7474 

a. Interprete o coeficiente de TFT. A priori , deverfamos esperar uma rela§ao positiva ou ne- 
gativa entre MI e TFT? Justifique sua resposta. 

b. Os valores dos coeficientes de PNBpc e de TAF alteraram-se com o calculo da nova regres¬ 
sao? Em caso afirmativo, qual(is) poderia(m) ser a(s) razao(oes)? A diferen 9 a observada e 
estatisticamente significativa? Que teste voce usou e por que? 

c. Como faria para escolher entre os modelos 1 e 2? Que testes estatisticos aplicaria para 
responder a essa pergunta? Mostre os calculos necessarios. 

d. Nao apresentamos o erro padrao do coeficiente de TFT. E possivel verificar qual e? ( Dica: 
reveja as redoes entre as distributes t e F.) 

32. Voltemos ao Exercicio 1.7, em que encontramos dados sobre impressoes retidas e or^amento 
publicitario em uma amostra de 21 empresas. No Exercicio 5.11, representamos esses dados 
graficamente e escolhemos um modelo adequado para relacionar as duas variaveis. 
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Tomando Y como impressoes retidas e X como gastos com publicidade, calculamos duas re- 
gressoes com os seguintes resultados: 

Modelol: Y, = 22,163 + 0,363 

ep= (7,089) (0,0971) r 2 = 0,424 

Modelo II: Y, = 7,059 + 1,084731, - 0.0040X 2 

ep= (9,986) (0,3699) (0,0019) R 2 = 0,53 

a. Interprete os dois modelos. 

b. Qual o melhor? Por que? 

c. Que testes estatlsticos voce usaria para escolher um dos modelos? 

d. Os gastos com publicidade apresentam “retornos decrescentes”, ou seja, apos certo nivel de 
gastos (nivel de satura?ao) a publicidade deixa de compensar? Poderiamos verificar qual e esse 
nivel? Mostre os calculos necessarios. 

8.33. Na regressao (7.9.4), apresentamos os resultados da fun£ao de produ£ao Cobb-Douglas ajus- 
tada ao setor de manufatura dos 50 Estados e do Distrito de Washington, para 2005. Com base 
nessa regressao, verifique se o setor registrou retornos constantes de escala empregando: 

a. O teste f dado na Equacjao (8.6.4). A covariancia entre os dois estimadores dos coeficientes 
angulares e igual a - 0,03843. 

b. O teste F dado na Equa£ao (8.6.9). 

c. Ha diferen?as entre os dois resultados? E qual a conclusao que podemos tirar em relagao 
aos retornos de escala no setor de manufatura dos 50 Estados e do distrito de Washington 
no periodo da amostra? 

8.34. Consideremos a regressao da poupan 9 a contra a renda dada na Sefao 8.7. Imagine que dividi- 
mos a amostra em dois periodos, de 1970 a 1982 e de 1983 a 1995. Verifique, aplicando a 
teste de Chow, se houve uma mudan 5 a estrutural na rela£ao poupan^a-rcntla nos dois periodos. 
Comparando os resultados obtidos agora com os apresentados na Se£ao 8.7, que conclusoes 
gerais podem ser tiradas a respeito da sensibilidade do teste de Chow a escolha do ponto de 
quebra que divide uma amostra em dois (ou mais) periodos? 

8.35. Votando ao Exercicio 7.24 e aos dados na Tabela 7.12 com rela£ao as quatro variaveis econo¬ 
micas nos Estados Unidos entre 1947-2000. 

a. Com base na regressao de gastos de consumo sob a renda real, riqueza real e taxa real de 
juros, verifique quais dos coeficientes de regressao sao, do ponto de vista estatistico, indi- 
vidualmente significativos no nivel de significancia de 5%. Os sinais dos coeficientes esti- 
mados estao de acordo com a teoria economica? 

b. Com base nos resultados de (a) como voce estimaria a clasticidadc-prcco, riqueza e taxa de 
juros? Que informaqiao adicional, se houver, e necessaria para calcular as elasticidades? 

c. Como voce testaria a hipotese de que a elasticidade-renda e riqueza sao as mesmas? Mostre 
os calculos necessarios. 

d. Suponha que, em vez da fiuujao linear de consumo estimada, voce fay a a regressao do loga- 
ritmo do consumo contra os logaritmos da renda, riqueza e taxa de juros. Mostre os resultados 
da regressao. Como voce interpreta os resultados? 

e. Quais as elasticidades-renda e riqueza estimadas em (d)‘! Como voce interpreta o coeficien- 
te da taxa de juros estimada em {d)l 

f. Voce poderia ter utilizado, na regressao em (d), o logaritmo da taxa de juros em vez da taxa 
de juros? Por que? 

g. Como voce compara as elasticidades estimadas em ( b) e em (d)? 

h. Entre os modelos de regressao estimados em ( a) e (d), qual voce prefere? Por que? 
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i. Suponha que, em vez de estimar o modelo dado em (d), voce apenas fa£a a regressao do lo- 
garitmo do consumo contra o logaritmo da renda. Como voce decide se vale a pena acrescen- 
tar o logaritmo da riqueza ao modelo? E como voce decide se vale a pena acrescentar tanto o 
logaritmo de riqueza quanto a taxa de juros no modelo? Mostre os calculos necessarios. 

8.36. Consulte a Se£ao 8.8 e os dados na Tabela 8.9 relativos a renda pessoal dispomvel e poupan£a 
para o periodo 1970-1995. Nesse ponto, o teste de Chow foi introduzido para verificar se ocor- 
reu uma mudan 5 a estrutural com os dados entre os dois perfodos. A Tabela 8.11 inclui dados 
contendo os valores atualizados de 1970-2005. De acordo com o National Bureau of Economic 
Research, o ciclo mais recente de contrata£ao dos Estados Unidos terminou no final de 2001. 
Divida os dados em tres se£6es: 

(1) 1970-1981, (2) 1982-2001 e (3) 2002-2005. 

a. Calcule os dois modelos para o total de dados (anos 1970-2005) e da terceira sec£ao (apos 
2002). Determine se ha uma quebra significativa entre o terceiro periodo e todo o conjunto de 
dados, utilizando o teste de Chow. 


TABELA 8.11 

Poupanga e 
rendimento pessoal 
dispomvel (bilhoes de 
dolares) Estados 
Unidos, 1970-2005 
(bilhoes de dolares, 
exceto conforme 
indicado; dados 
trimestrais ajustados 
sazonalmente para 
frequencia anual) 

Fonte: Department of Com¬ 
merce, Bureau of Economic 
Analysis. 


Ano 

Poupan^a 

Renda 

1970 

69,5 

735,7 

1971 

80,6 

801,8 

1972 

77,2 

869,1 

1973 

102,7 

978,3 

1974 

113,6 

1.071,6 

1975 

125,6 

1.187,4 

1976 

122,3 

1.302,5 

1977 

125,3 

1.435,7 

1978 

142,5 

1.608,3 

1979 

159,1 

1.793,5 

1980 

201,4 

2.009,0 

1981 

244,3 

2.246,1 

1982 

270,8 

2.421,2 

1983 

233,6 

2.608,4 

1984 

314,8 

2.912,0 

1985 

280,0 

3.109,3 

1986 

268,4 

3.285,1 

1987 

241,4 

3.458,3 

1988 

272,9 

3.748,7 

1989 

287,1 

4.021,7 

1990 

299,4 

4.285,8 

1991 

324,2 

4.464,3 

1992 

366,0 

4.751,4 

1993 

284,0 

4.911,9 

1994 

249,5 

5.151,8 

1995 

250,9 

5.408,2 

1996 

228,4 

5.688,5 

1997 

218,3 

5.988,8 

1998 

276,8 

6.395,9 

1999 

158,6 

6.695,0 

2000 

168,5 

7.194,0 

2001 

132,3 

7.486,8 

2002 

184,7 

7.830,1 

2003 

174,9 

8.162,5 

2004 

174,3 

8.681,6 

2005 

34,8 

9.036,1 
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b. Com os dados novos da Tabela 8.11, determine se existe uma diferenga significativa entre o 
primeiro conjunto de anos (1970-1981) e o conjunto de dados completo, agora que ha um 
maior numero de observances dispomveis. 

c. Faga o teste de Chow no perfodo intermediario (1982-2001) versus aquele com o total de 
dados para ver se os dados nesse periodo comportaram-se de modo significativamente di- 
ferente do que o resto dos dados. 


Teste da razao de verossimilhanga (RV) 

O teste RV esta embasado no prindpio da maxima verossimilhanga (MV) examinado no Apendice 4A, em 
que mostramos como obter os estimadores de MV para o modelo de regressao com duas variaveis. O prindpio 
pode ser aplicado diretamente ao modelo de regressao multipla. Sob a hipotese de que os termos de erro w, sao 
distribuidos normalmente, mostramos que, para o modelo de regressao com duas variaveis, os estimadores dos 
coeficientes de regressao de MQO e os de MV eram identicos, mas a variancia dos erros estimados eram dife- 
rentes. O estimador de MQO de a 2 e tf/( n ~ 2), mas o estimador de MV e &j/n, sendo o primeiro nao 
viesado e o segundo viesado, embora, no caso de amostras grandes, o vies tenda a desaparecer. O mesmo e valido 
para o caso de regressao multipla. Para ilustrarmos, vejamos um modelo de regressao com tres variaveis: 



Yi - P i + PiXii + PiXy + u, 


0) 


Correspondendo a Equagao (5) do Apendice 4A, a fungao de verossimilhanga (FV) logaritmica do modelo 
(1) pode ser escrita como: 



( 2 ) 


Como mostrou o Apendice 4A, diferenciando esta fungao em relagao a p x , p 2 , Pi, e rr, igualando as expres¬ 


s5es resultantes a zero e resolvendo, obtemos os estimadores de MV destes parametros. Os estimadores de MV 
para P\,P 2 e, /? 3 sao identicos aos estimadores de MQO que ja foram dados nas Equagoes (7.4.6) a (7.4.8), mas 
a variancia do erro sera diferente, ja que a soma dos quadrados dos residuos (SQR) sera dividida por n em lugar 
de (n — 3), como no caso dos minimos quadrados ordinarios. 

Agora, imaginemos que a hipotese nula H 0 seja que /? 3 , o coeficiente de X 3 , e igual a zero. Neste caso, o 
logaritmo da FV dado em (2) se tornara: 



(3) 


A Equaciio (3) e conhecida como fun^ao de verossimilhanna logaritmica com restrigoes (FVLCR), 
porque e estimada com a restrijao a priori de que /? 3 e igual a zero, enquanto a Equa^ao (1) e conhecida como 
a limcao de verossimilhanca logaritmica sem rest riches (FVLSR), porque nao sao impostas restricoes a 
priori sobre os parametros. Para testar a validade da restrigao a priori de que /? 3 e igual a zero, o teste da razao 
de verossimilhanga gera a seguinte estatistica: 


(4) f 


k = 2(FVLSR- FVLCR) 


em que FVLSR e FVLCR sao, respectivamente, a fungao de verossimilhanga logaritmica sem restrigdes (Equa- 
gao (2)) e a fungao de verossimilhanga logaritmica com restrigoes (Equagao (3)). Se o tamanho da amostra for 
grande, pode-se demonstrar que o teste estatistico A dado na Equagao (4) segue a distribuigao de qui-quadrado 
(X 2 ) com numeros de graus de liberdade iguais ao numero de restrigdes impostas pela hipotese nula, 1 neste 
caso. 

A ideia basica por tras do teste de RV e simples: se uma ou mais restrigdes a priori forem validas, os FV 
(logarftmicos) restrito e sem restrigdes nao deveriam ser diferentes e, assim, A na Equagao (4) seria igual a zero. 
Mas, se esse nao for o caso, os dois FV divergirao. Como sabemos que, para grandes amostras, A segue a 


* Opcional 

+ Esta expressao tambem pode ser escrita nas formas -2(FVLCR - FVLSR) ou -2 In (FVCR/FVSR). 
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distribuigao de qui-quadrado, podemos verificar se a divergencia e estaticamente significativa em 1% ou 5%. 
Ou podemos encontrar o valor p do X estimado. 

Ilustraremos o teste de RV recorrendo ao exemplo da mortalidade infantil. Se fizermos a regressao da mor- 
talidade infantil (MI) contra o PNB per capita (PNBpc) e a taxa de alfabetizagao feminina (TAF), como fize- 
mos na Equagao (8.1.4), obteremos uma FVLSR de —328,1012, mas, se fizermos a regressao apenas contra o 
PNBpc, a FVLCR sera de -361,6396. Em termos de valor absolute (desconsiderando o sinal), o primeiro e 
maior que o segundo, o que faz sentido, pois ha uma variavel adicional no primeiro modelo. 

A questao agora e saber se vale a pena acrescentar a variavel TAF. Se nao valer a pena, as fungoes logarftmicas 
de verossimilhanga com e sem restrigoes nao serao muito diferentes, mas, em caso positivo, elas serao diferentes. 
Para verificannos se a diferenga e estatisticamente significativa, empregamos agora o teste de RV dado na 
Equagao (4), que nos da: 


a = 2[-328,1012- (-361,6396)]= 67,0768 


Isso e distribuldo assintoticamente segundo a distribuigao qui-quadrado com 1 grau de liberdade (porque 
so impusemos uma restrigao ao omitir a variavel TAF do modelo). O valor p da obtengao de tal valor de 
qui-quadrado com um grau de liberdade esta muito proximo de zero, levando-nos a conclusao de que a variavel 
TAF nao deveria ser exclufda do modelo. Em outras palavras, a regressao restrita, neste caso, nao e valida. 

Vamos permitir que SRQR e SSRQR denote a soma, restrita e nao restrita, dos quadrados dos reslduos, a 
Equagao (4) pode tambem ser expressa como: 

- 2 In A. = «(ln SRQR - In SSRQR) (5) 


que e distribulda como x 2 com r graus de liberdade, em que reo numero de restrigoes impostas ao modelo (o 
numero de coeficientes r omitidos do modelo original). Contudo, nao entraremos em detalhes sobre os testes de 
Wald e ML; eles podem ser implementados como se segue: 


Estatlstica de Wald (W) = 


(n- £)(SRQR- SSRQR) 
SSRQR 


( 6 ) 


Estatlstica do Multiplicador de Langrage (LM) 


(n - k+ / )(SRQR-SSRQR) 
SRQR 


(7) 


em que ke o numero de regressores no modelo sem restrigoes ere o numero de restrigoes. 

Como voce pode observar nas equagoes anteriores, todos os tres testes sao assintoticamente equivalentes, 
ou seja, fornecem respostas semelhantes. Entretanto, em amostras pequenas as respostas podem divergir. 

Ha uma relagao interessante entre estas estatlsticas em que se pode demonstrar que: 


W > RV > ML 


Contudo, em amostras pequenas, uma hipotese pode ser rejeitada pela estatlstica Wald, mas nao pela esta¬ 
tlstica ML. 

Como observado no texto, para a maioria dos nossos objetivos, os testes de t e F serao suficientes. Mas, os 
tres testes discutidos sao de aplicaqao geral e podem ser usados para verificar hipoteses nao lineares em mode- 
los lineares, ou verificar restr^des em matrizes de variancia-covariancia. Eles tambem podem ser aplicados em 
situagoes em que a hipotese de que os erros sao normaimente distribuldos nao e defensavel. 

Dada a complexidade matematica dos testes de Wald e da maxima verossimilhanga, nao os examinaremos 
aqui. Mas, como ja mencionamos, assintoticamente, os testes ML, de Wald e de RV dao respostas identicas, de 
modo que a escolha depende da conveniencia de calculo. 


Pra uma explicagao, veja MADALLA, G. S. Introduction to econometrics, 3. ed. Nova York: John Wiley & Sons, 
New York, 2001. p. 1 77. 





Capitulo 

Modelos de regressao 
com variaveis binarias 
(dummies) 

No Capftulol discutimos brevemente os quatro tipos de variaveis que em geral encontram-se em 
analise empmca. Sao eles: variaveis proporcionais, de intervalo, ordinais e nominais. Os tipos de 
variaveis que encontramos nos capftulos anteriores eram essencialmente proporcionais, mas isso nao 
deveria dar a impressao de que os modelos de regressao so podem lidar com variaveis proporcionais. 
Os modelos de regressao tambem trabalham com os outros tipos de variaveis mencionadas anterior- 
mente. Neste capitulo, consideraremos modelos que podem envolver nao so variaveis proporcio¬ 
nais, mas tambem variaveis de escala nominal. Tais variaveis sao conhecidas ainda como variaveis 
indicadoras, de categoria, qualitativas ou binarias (dummies). 1 



9.1 A natureza das variaveis dummies 

Em analise de regressao a variavel dependente, ou regressando, e influenciada com frequencia 
nao so pelas variaveis proporcionais (renda, produto, precos, custos, altura, temperatura), mas pelas 
variaveis que sao de natureza essencialmente qualitativa, ou escala nominal, como genero, ra£a, cor, 
religiao, nacionalidade, regiao geografica, movimentos politicos e afiliafao partidaria. Por exemplo, 
mantendo os demais fatores constantes, verificou-se que as mulheres ganham menos que os homens 
ou que trabalhadores nao brancos ganham menos que os brancos. 2 Esse padrao pode resultar de dis- 
crimina?ao de genero ou racial; qualquer que seja a razao, as variaveis qualitativas como genero e 
ra?a parecem influenciar o regressando e deveriam, claramente, ser incluidas entre as variaveis 
explanatorias ou os regressores. 

Tais variaveis em geral indicam a presen 9 a ou ausencia de uma “qualidade” ou atributo, como 
homens ou mulheres, negros ou brancos, catolicos ou nao catolicos, democratas ou republicanos, 
elas sao essencialmente variaveis nominais. Poderiamos “quantificar” tais atributos formulando va¬ 
riaveis artificiais que assumem valores de 1 ou 0, em que 1 indica a prcsenga (ou posse) daquele 
atributo e 0, a ausencia dele. Por exemplo, 1 pode indicar que uma pessoa e mulher e 0 designar que 
e homem; ou 1 pode indicar que uma pessoa tem grau superior completo e 0, que nao tem e assim 
por diante. 


1 Discutiremos variaveis de escala ordinal no Capitulo 15. 

2 Para uma revisao deste assunto, veja KAUFMAN, Bruce E.; HOTCHKISS, Julie L. The economics of labor markets. 5. 
ed. Nova York: Dryden Press, 2000. 
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Variaveis que assumem esses valores 0 e 1 sao chamadas variaveis binarias {dummies)? Portan- 
to, elas sao essencialmente um dispositivo para classificar dados em categorias mutuamente exclu- 
sivas como homem ou mulher. 

As variaveis dummies podem ser incorporadas aos modelos de regressao com tanta facilidade 
quanto as quantitativas. De fato, um modelo de regressao pode conter regressores de natureza exclu- 
sivamente dummy ou qualitativa. Estes sao os chamados modelos de analise de variancia 
(ANOVA) 4 

9.2 Modelos ANOVA 

Para ilustrar os modelos ANOVA, considere o seguinte exemplo: 


EXEMPLO 9.1 

Saldrios de 
professores da 
rede publica por 
regido 
geografica 


A Tabela 9.1 apresenta dados sobre o salario medio (em dolares) de professores de escolas 
publicas em 50 Estados e no Distrito de Columbia para o ano escolar de 2005-2006. Essas 51 
areas sao classificadas em tres regioes geograficas: (1) Nordeste e Centro-Norte (21 Estados 
no total), (2) Sul (1 7 Estados no total) e (3) Oeste (1 3 Estados no total). Por ora, nao se preo- 
cupe com o formato da tabela e outras informa^oes especificadas. 

Vamos verificar se o salario anual medio de professores da rede publica difere entre as tres 
regioes geograficas do pafs. Se tomarmos a media aritmetica simples dos salarios medios dos 
professores nas tres regioes, veremos que essas medias para as tres regioes sao as seguintes: 
$ 49.538,71 (Nordeste e Centro-Norte), $ 46.293,59 (Sul) e $ 48.104,62 (Oeste). Esses nu- 
meros parecem diferentes, mas seriam estatisticamente diferentes uns dos outros? Ha varias 
tecnicas estatfsticas para comparar dois ou mais valores medios, que em geral sao chamadas 
analise de variancia . 5 

No entanto, o mesmo objetivo pode ser alcangado dentro do marco de referenda da 
analise de regressao. Para tanto, imaginemos o seguinte modelo: 


Yi — P i + P 2 D 2 i + PaDjj + u. 


(9.2.1) 


em que Y-, = salario (medio) de professor da rede publica no Estado / 

D 2 , = 1 se o Estado for do Nordeste ou do Norte Central 
= 0 se nao for (se for situado em outras regioes do pafs) 

D3, = 1 se o Estado pertencer a regiao Sul 

= 0 se nao pertencer (se for localizado em outras regioes) 

Note que a Equagao (9.2.1) e como qualquer modelo de regressao multipla considerado 
anteriormente, exceto que, em vez de regressores quantitativos, temos apenas regressores 
qualitativos ou binarios, assumindo o valor 1 se a observagao pertencer a determinada cate- 
goria e 0 se nao pertencer aquela categoria ou grupo. Dai em diante, designaremos todas as 
variaveis dummies peia letra D. A Tabela 9.1 mostra as variaveis dummies assim construfdas. 

( Continua ) 


3 Nao e absolutamente essencial que as variaveis dummies assumam os valores de 0 e 1. O par (0,1) pode ser trans- 
formado em qualquer outro par por uma fun^ao linear tal que Z = a + bD {b * 0), em que a e b sao constantes e 
D = 1 ou 0. Quando D = 1, temos Z = a + b, e quando D = 0, temos Z = a. Assim, o par (0, 1) torna-se (a, 0 + b). 
Por exemplo, se 0 = 1 e b = 2, as variaveis dummies serao (1, 3). Esta expressao mostra que variaveis qualitativas, ou 
dummies, nao tem uma escala natural de medida. Por isso sao descritas como variaveis de escala nominal. 

4 Os modelos ANOVA devem ser usados para avaliar o significado estatfstico da relagao entre um regressando quan¬ 
titative e regressores binarios ou qualitativos. Eles sao usados com frequencia para comparar as diferengas nos va¬ 
lores medios de dois ou mais grupos ou categorias e sao, portanto, mais gerais que o teste t, que pode ser usado 
para comparar as medias de apenas dois grupos ou categorias. 

5 Para um tratamento aplicado, veja FOX, John. Applied regression analysis, linear models, and related methods. Sage 
Publications, 1997. cap. 8. 
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( Continuagao ) 

TABELA 9.1 Salario medio de professores de escolas da rede publica por estado, 2005-2006 



Salario 

Gastos 

d 2 

Dj 


Salario 

Gastos 

d 2 

D 3 

Connecticut 

60.822 

12.436 

1 

0 

Georgia 

49.905 

8.534 

0 

1 

Illinois 

58.246 

9.275 

1 

0 

Kentucky 

43.646 

8.300 

0 

1 

Indiana 

47.831 

8.935 

1 

0 

Louisiana 

42.816 

8.519 

0 

1 

Iowa 

43.130 

7.807 

1 

0 

Maryland 

56.927 

9.771 

0 

1 

Kansas 

43.334 

8.373 

1 

0 

Mississippi 

40.182 

7.215 

0 

1 

Maine 

41.596 

11.285 

1 

0 

Carolina do Norte 

46.410 

7.675 

0 

1 

Massachusetts 

58.624 

12.596 

1 

0 

Oklahoma 

42.379 

6.944 

0 

1 

Michigan 

54.895 

9.880 

1 

0 

Carolina do Sul 

44.133 

8.377 

0 

1 

Minnesota 

49.634 

9.675 

1 

0 

Tennessee 

43.816 

6.979 

0 

1 

Missouri 

41.839 

7.840 

1 

0 

Texas 

44.897 

7.547 

0 

1 

Nebraska 

42.044 

7.900 

1 

0 

Virginia 

44.727 

9.275 

0 

1 

New Hampshire 

46.527 

10.206 

1 

0 

West Virginia 

40.531 

9.886 

0 

1 

Nova Jersey 

59.920 

13.781 

1 

0 

Alaska 

54.658 

10.171 

0 

0 

Nova York 

58.537 

13.551 

1 

0 

Arizona 

45.941 

5.585 

0 

0 

Dakota do Norte 

38.822 

7.807 

1 

0 

California 

63.640 

8.486 

0 

0 

Ohio 

51.937 

10.034 

1 

0 

Colorado 

45.833 

8.861 

0 

0 

Pensilvania 

54.970 

10.711 

1 

0 

Havaf 

51.922 

9.879 

0 

0 

Rhode Island 

55.956 

11.089 

1 

0 

Idaho 

42.798 

7.042 

0 

0 

Dakota do Sul 

35.378 

7.911 

1 

0 

Montana 

41.225 

8.361 

0 

0 

Vermont 

48.370 

12.475 

1 

0 

Nevada 

45.342 

6.755 

0 

0 

Wisconsin 

47.901 

9.965 

1 

0 

Novo Mexico 

42.780 

8.622 

0 

0 

Alabama 

43.389 

7.706 

0 

1 

Oregon 

50.911 

8.649 

0 

0 

Arkansas 

44.245 

8.402 

0 

1 

Utah 

40.566 

5.347 

0 

0 

Delaware 

54.680 

12.036 

0 

1 

Washington, D.C. 

47.882 

7.958 

0 

0 

Distrito de 

59.000 

15.508 

0 

1 

Wyoming 

50.692 

11.596 

0 

0 

Columbia 










Florida 

45.308 

7.762 

0 

1 







Nota: D 2 = 1 para Estados no Nordeste e Centro-Norte; 0 para Estados de outras regioes. 
Z) 3 = 1 para Estados no Sul; 0 para Estados em outras regioes. 


Fonte: National Educational Association, como relatado em 2007. 


O que o modelo (9.2.1) nos diz? Pressupondo que o termo de erro satisfaga os pressupos- 
tos usuais de MQO, ao tomar a esperanga ou valor esperado da Equagao (9.2.1) em ambos 
os lados, obtemos: 

Salario medio de professores da rede publica no Nordeste e Centro Norte 


E(Y, | D 2 , = 1 ,D 3/ = 0)= ft + p 2 


(9.2.2) 


Salario medio de professores da rede publica de ensino no Sul: 


E(Yj | D 2i = 0, Da = 1) = f)-\ + 


(9.2.3) 


Poderfamos desejar saber como descobrimos o salario medio de professores no Oeste. Se 
supusessemos que este e igual ao y3 lf estarfamos absolutamente certos, pois: 

Salario medio de professores da rede publica de ensino no Oeste: 

E(Y, | D 2 , = 0, Da = 0) = fa (9.2.4) 


( Continua ) 
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EXEMPLO 9.1 

( Continuagao ) 


Em outras palavras, o salario medio de professores da rede publica de ensino no Oeste e dado 
pelo intercepto, na regressao multipla (9.2.1), e os coeficientes "angulares" /1 2 e dizem 
quanto os salarios medios de professores no Nordeste e Centro-Norte e no Sul diferem do 
salario medio de professores no Oeste. Mas como sabemos se essas diferen^as sao estatistica- 
mente significativas? Antes de respondermos, vamos apresentar os resultados com base na 
regressao (9.2.1) com os dados da Tabela 9.1: 


Yj = 48.014,615 + 

ep= (1857,204) 
t= (25,853) 
(0,0000)* 


1.524,099D 2 , - 
(2363,139) 
(0,645) 
(0,5220)* 


1.721,02703, 
(2467,151) 
(-0,698) 
(0,4888)* 


R 2 = 0,0440 


(9.2.5) 


em que * indica os valores p. 

Como esses resultados de regressao mostram, o salario medio de professores no Oeste e 
cerca de $ 48.015, o dos professores do Nordeste e Centro-Norte e cerca de $ 1.524 mais 
alto e o de professores no Sul e cerca de $ 1.721 mais baixo. Os salarios medios reais nas duas 
ultimas regioes podem ser facilmente obtidos adicionando esses salarios diferenciais ao sala¬ 
rio medio de professores no Oeste, como mostram as Equates (9.2.3) e (9.2.4). Desse 
modo, verificaremos que os salarios medios nas duas ultimas regioes sao de aproximadamen- 
te $ 49,539 e $ 46,294. 

Mas como sabemos que esses salarios medios sao estatisticamente diferentes do salario 
medio de professores no Oeste, a categoria de compara^ao? Facil. Basta descobrir se cada 
um dos coeficientes "angulares" na Equagao (9.2.5) e estatisticamente significativos. Como 
podemos ver dessa regressao, o coeficiente angular estimado para o Nordeste e Centro- 
-Norte nao e estatisticamente significativo, uma vez que seu valor p e 52%, e aquele do Sul 
tambem nao e estatisticamente significativo, visto que o valor p e cerca de 49%. Portanto, a 
conclusao geral e que estatisticamente os salarios medios dos professores de escola publica 
no Oeste, no Nordeste, no Centro-Norte e no Sul sao iguais. A situag:ao e representada grafi- 
camente na Figura 9.1. 

Convem fazer uma advertencia quanto a interpretagao dessas diferengas. As variaveis 
dummies apenas apontarao as diferen^as, se existirem, mas nao sugerem as razoes para as 
diferen^as. Diferengas em nfveis educacionais, indices de custo de vida, genera e raga podem 
ter efeito nas diferengas observadas. Portanto, se nao considerarmos todas as demais varia¬ 
veis que podem afetar o salario de um professor, nao seremos capazes de identificar as causas 
das diferen^as. 

Da discussao anterior, fica claro que basta verificar se os coeficientes ligados as diversas 
variaveis dummies sao individualmente significativos, do ponto de vista estatistico. Este 
exemplo tambem mostra como e facil incorporar regressores qualitativos ou binarios nos 
modelos de regressao. 


FIGURA 9.1 

Salario medio (em 
dolares) de 
professores de 
escola publica nos 
Estados Unidos em 
tres regioes. 


= $49,539 


$48,015 (/?! + A 2 ) 


$46,294 (/?j + /? 3 ) 


Nordeste e 
Centro-Norte 


Oeste 


Sul 
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Advertencia quanto ao uso de variaveis dummies 

Embora seja facil incorpora-las aos modelos de regressao, deve-se usar as variaveis dummies com 
cautela. Em particular, considere os seguintes aspectos: 

1. No Exemplo 9.1, para distinguir as tres regioes, usamos apenas duas variaveis dummies, l) 2 
e D 3 . Por que nao usamos tres variaveis dummies para distinguir as tres regioes? Suponha 
que fagamos isso e escrevamos o modelo (9.2.1) como: 

Yj - a + f$\D\i + fcDu + PiDzi + m , ( 9 . 2 . 6 ) 

em que Z)], assume o valor de 1 para Estados no Oeste e 0 para as demais regioes. Agora temos 
uma variavel dummy para cada uma das tres regioes geograficas. Usando os dados da Tabela 
9.1, se voce tivesse de fazer a regressao (9.2.6), o computador se “recusaria” a efetua-la 
(experimente). 6 Por que? A razao e que, na montagem da Equagao (9.2.6), na qual ha uma 
variavel dummy para cada categoria ou grupo e tambem um intercepto, existe um caso de co- 
linearidade perfeita, isto e, relates lineares exatas entre as variaveis. Por que? Consulte a 
Tabela 9.1. Imagine que agora acrescentemos a coluna I)\, assumindo o valor de 1 sempre que 
um Estado estiver no Oeste e 0 nas demais regioes. Agora, se voce acrescentar as tres colunas 
D horizontalmente, obtera uma coluna que tem 51 uns nela. Mas, como o valor do intercepto 
a e (implicitamente) 1 para cada observagao, voce tera uma coluna que tambem content 51 uns. 
Em outras palavras, a soma das tres colunas D apenas reproduzira a coluna intercepto, levando 
a colinearidade perfeita. Neste caso, a estimagao do modelo (9.2.6) e impossrvel. 

A mensagem aqui e: se uma variavel qualitativa tem m categorias, introduza apenas (in 
— 1) variaveis binarias. Em nosso exemplo, uma vez que a variavel qualitativa “regiao” 
tem tres categorias, introduzimos apenas duas variaveis binarias. Se voce nao seguir essa 
regra, caira no que e chamado de armadilha da variavel binaria: a situagao de colinearida¬ 
de perfeita ou multicolinearidade perfeita, se houver mais de uma relagao exata entre as va¬ 
riaveis. Essa regra tambem se aplica se temos mais de uma variavel qualitativa no modelo, 
caso exemplificado mais adiante. Deveriamos reformular a regra anterior como: para cada 
regressor qualitativo, o numero de variaveis binarias introduzidas deve ser um a menos 
que as categorias daquela variavel. Se no Exemplo 9.1. tfnhamos informagao sobre o ge¬ 
nera do professor, usanamos uma variavel binaria adicional (mas nao duas) assumindo um 
valor de 1 para mulheres e 0 para homens ou vice-versa. 

2. A categoria para a qual nenhuma variavel binaria e atribuida e conhecida como categoria-base, 
de controle, de comparagao, de referencia ou categoria omitida. Todas as comparagoes sao 
feitas em relagao a categoria de referencia. 

3. O valor do intercepto (/3{) representa o valor medio da categoria de referencia. No Exemplo 
9.1, a categoria de referencia e a regiao Oeste. Dai, na regressao (9.2.5), o valor do intercep¬ 
to de cerca de 48.015 representa o salario medio de professores nos Estados do Oeste. 

4. Os coeficientes ligados as variaveis binarias na Equagao (9.2.1) sao conhecidos como coefi- 
cientes diferenciais de intercepto, porque informam quanto a categoria que recebe o valor 
de 1 difere do coeficiente do intercepto da categoria de referencia. Por exemplo, na Equagao 
(9.2.5), o valor aproximado de 1.524 indica que o salario medio de professores no Nordeste 
ou Centro-Norte e cerca de $ 1.524 a mais do que o salario medio de aproximadamente 
US$48,015 para a categoria de referencia, a regiao Oeste. 

5. Se uma variavel qualitativa apresentar mais de uma categoria, como em nosso exemplo, a 
escolha da categoria de referencia ficara estritamente a criterio do pesquisador. As vezes a esco- 
lha do referencial e ditada por determinado problema. No exemplo, poderfamos ter escolhido 
o Sul como categoria de referencia. Nesse caso os resultados de regressao da Equagao (9.2.5) 
mudariam, porque agora todas as comparagoes seriam feitas em relagao ao Sul. Evidentemente, 


6 Na realidade voce recebera uma mensagem informando que a matriz de dados e singular. 
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isso nao mudaria a conclusao geral do exemplo (por que?). O valor do intercepto seria de 
aproximadamente $ 4 6.294, que e o salario medio de professores no Sul. 

6. Fizemos uma advertencia quanto a armadilha da variavel binaria. Ha uma forma de contor- 
nar essa armadilha introduzindo tantas variaveis binarias quanto o numero de categorias 
daquela variavel, contanto que ndo seja introduzido o intercepto em tal modelo. Se excluir- 
mos o termo de intercepto da Equagao (9.2.6) e considerarmos o modelo a seguir, 

Yj = fi\D\i + PiDu + PiJJj, + Uj ( 9 . 2 . 7 ) 

nao cairemos na armadilha da variavel dummy, pois nao ha mais colinearidade perfeita. 
Mas, ao calcular essa regressao, assegure-se de que voce usou a opcdo sem intercepto do 
programa de regressao. 

Como interpretamos a regressao (9.2.7)? Se tomarmos o valor esperado da Equagao (9.2.7), 
constataremos que: 

/Sj = salario medio de professores no Oeste 

/3 2 = salario medio de professores no Nordeste e Centro-Norte 

/S 3 = salario medio de professores no Sul 

Em outras palavras, suprimindo o intercepto e permitindo uma variavel binaria para cada 
categoria, obtemos diretamente os valores medios das diversas categorias. Os resultados da 
Equagao (9.2.7) para nosso exemplo sao os seguintes: 

% = 48.014,620!, + 49.538,710 2l + 46.293,590 3 , 

ep = (1857,204) (1461,240) (1624,077) ( 9 . 2 . 8 ) 

t = (25,853)* (33,902)* (28,505)* 

R 2 = 0,044 

em que * indica que os valores p dessas razoes t sao muito pequenos. 

Como voce pode ver, os coeficientes da variavel binaria dao diretamente os valores medios 
(salario) nas tres regioes, Oeste, Nordeste e Centro-Norte e Sul. 

7. Qual o melhor metodo de introduzir uma variavel binaria: (1) introduzir uma variavel bina¬ 
ria para cada categoria e omitir o termo de intercepto ou (2) incluir o termo de intercepto e 
introduzir apenas variaveis binarias (in — 1), em que m e o numero de categorias da variavel 
binaria? Como observa Kennedy: 

A maioria dos pesquisadores acredita que a equagao com um intercepto seja mais conveniente, porque 
lhes permite tratar com mais facilidade as questoes em que geralmente tern mais interesse, ou seja, se a 
categorizagao faz diferenga e, se fizer, de quanto e essa diferenga. Se a categorizagao faz diferenga, essa 
e medida diretamente por estimativas do coeficiente da variavel binaria. Podemos verificar se a catego¬ 
rizagao e ou nao relevante efetuando um teste t de um coeficiente da variavel binaria contra zero (ou, 
para ser mais geral, um teste F do conjunto adequado de estimativas do coeficiente da variavel 
binaria). * * * 7 


9.3 Modelos ANOVA com duas variaveis qualitativas 

Na segao anterior consideramos o modelo ANOVA com uma variavel qualitativa com tres catego¬ 

rias. Nesta segao consideraremos outro modelo ANOVA, mas com duas variaveis qualitativas e apre- 

sentaremos alguns pontos adicionais sobre variaveis binarias. 


7 KENNEDY, Peter. A guide to econometrics. 4. ed. Cambridge, Mass.: MIT Press, 1998. p. 223. 
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EXEMPLO 9.2 

Ganho por hora 
em relagao a 
estado civil e 
regiao de 
residencia 


De uma amostra de 528 pessoas de maio de 1985, os seguintes resultados de regressao 
foram obtidos: 8 


?, = 8,8148 + 

1,0997D 2/ 

- 1,672903, 

ep= (0,4015) 

(0,4642) 

(0,4854) 

t= (21,9528) 

(2,3688) 

(- 3,4462) 

(0,0000)* 

(0,0182)* 

(0,0006)* 



R 2 = 0,0322 


em que Y = salario por hora ($) 

D 2 = estado civil; 1 = casado, 0 = outros 

D 3 = regiao de residencia; 1 = Sul, 0 = outras regioes 

e * denota os valores p. 

Neste exemplo temos dois regressores qualitativos, cada um com duas categorias. Desse 
modo atribufmos uma unica variavel binaria para cada categoria. 

Qual a categoria de referenda aqui? Obviamente, e nao casado, nao residente no Sul. Em 
outras palavras, pessoas nao casadas que nao moram no Sul sao a categoria omitida. Todas 
as comparagoes sao feitas em relagao a esse grupo. O ganho medio/salario medio por hora 
nessa referenda e de aproximadamente $ 8,81. Comparado com este, o ganho medio/sala¬ 
rio medio por hora daqueles que sao casados e cerca de $ 1,10 mais alto, ganho medio real 
por hora de $ 9,91 (= 8,81 + 1,10). Em contrapartida, para aqueles que moram no Sul, o 
salario medio por hora e de cerca de $ 1,67 mais baixo, um ganho medio real por hora de 
$ 7,14. 

Os ganhos medios por hora sao estatisticamente diferentes em comparagao a categoria- 
-base? Sao, pois todos os interceptos diferenciais sao estatisticamente significativos, ja que seus 
valores p sao bastante baixos. 

Deve-se observar o seguinte neste exemplo: depois de irmos alem da variavel qualitativa, 
precisamos prestar atengao a categoria-base, uma vez que todas as comparagdes sao feitas em 
relagao aquela categoria. Isso e importante principalmente quando temos varios regressores qua¬ 
litativos, cada um com diversas categorias. Mas, a essa altura, o procedimento de introdu^ao 
de diversas variaveis qualitativas deve estar claro. 


9.4 Regressao com uma mistura de regressores quantitativos e 
qualitativos: os modelos ANCOVA 

Os modelos ANOVA discutidos nas duas se 9 oes anteriores, embora sejam comuns em areas 
como sociologia, psicologia, educa 9 ao e pesquisa de mercado, nao sao tao comuns em economia. 
Tipicamente, na maioria das pesquisas economicas, um modelo de regressao contem algumas 
variaveis explanatorias quantitativas e algumas qualitativas. Os modelos de regressao com uma 
mistura de variaveis quantitativas e qualitativas sao chamados de modelos de analise de covariancia 
(ANCOVA). Eles sao uma extensao dos modelos ANOVA no sentido de que fornecem um metodo 
de controle estatfstico dos efeitos de regressores quantitativos, chamados covariaveis ou varia¬ 
veis de controle, em um modelo que inclui tanto regressores quantitativos quanto qualitativos ou 
binarios. Agora ilustraremos os modelos ANCOVA. 


Esses valores provem do disco de dados de GOLDBERGER, Arthur S. Introductory econometrics. Cambridge, 
Mass.: Eiarvard University Press, 1998. Ja consideramos esses dados no Capftulo 2. 






Capftulo 9 Modelos de regressao com varidveis bindrias (dummies) 295 


EXEMPLO 9.3 

Salario de 
professores em 
relagao a regido 
e a gastos em 
escolas publicas 
por aluno 


Para motivar a analise, reconsideremos o Exemplo 9.1. Contudo, suponhamos que o salario 
medio de professores da rede publica nao seja diferente nas tres regioes, se levarmos em consi- 
dera^ao quaisquer variaveis que nao podem ser padronizadas. Considere, por exemplo, a variavel 
gastos das autoridades locais com a escola publica, ja que a educagao publica e basicamente uma 
questao local e estadual. Para ver se e esse o caso, desenvolvemos o modelo a seguir: 

Yj = 0i + 02 Du + PsDn + 04X, + Ui (9.4.1) 

em que V) = salario medio anual de professores da rede publica do Estado ($) 

X, = gastos com escolas publicas por aluno ($) 

D 2 , = 1 se o Estado for do Nordeste ou do Centro-norte; 

= 0, caso contrario; 

D 3 , = 1, se o Estado for da regiao Sul; 

= 0, caso contrario. 


Os dados sobre X estao na Tabela 9.1. Lembre-se de que estamos considerando o Oeste 
como a categoria de referenda. Note tambem que, alem dos dois regressores qualitativos, 
temos uma variavel quantitativa, X, que no contexto dos modelos ANCOVA e conhecida 
como covariavel. 

Dos dados da Tabela 9.1, os resultados do modelo (9.4.1) sao os seguintes: 


?i= 28.694,918 - 2.954,127D 2 , - 3.112,194D 3 , + 2,3404X, 

ep= (3262,521) (1862,576) (1819,873) (0,3592) 

t= (8,795)* (-1,586)** (-1,710)** (6,515)* (9.4.2) 

R 2 = 0,4977 

em que * indica valores p menores que 5% e ** indica valores p maiores que 5%. 

Como esses resultados sugerem, ceteris paribus, quando os gastos publicos sobem 1 dolar, 
em media, o salario de um professor da rede publica aumenta cerca de $ 2.34. Controlando 
os gastos com educa^ao, agora vemos que o coeficiente do intercepto diferencial nao e signi¬ 
ficative para a regiao Nordeste, Centro-Norte nem para a regiao Sul. Esses resultados sao di- 
ferentes daqueles da Equagao (9.2.5). Mas isso nao deveria surpreender, pois na Equa^ao 
(9.2.5) nao consideramos as diferen^as da covariavel gastos publicos com educafao, por 
aluno. Temos a situag:ao representada graficamente na Figura 9.2. 

Note que, embora tenhamos mostrado tres linhas de regressao para as tres regioes, esta- 
tisticamente as linhas de regressao sao as mesmas para todas as tres regioes. Observe ainda 
que as tres linhas de regressao sao trafadas paralelamente. (Por que?) 


FIGURA 9.2 

Salario do 
professor em 
escola publica nos 
Estados Unidos (T) 
em relagao a gasto 
com educa§ao por 
aluno (X). 


Y 
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9.5 A variavel binaria alternativa ao teste de Chow 9 


Na Segao 8.7 discutimos o teste de Chow para examinar a estabilidade estrutural de um modelo de 
regressao. O exemplo referia-se a relagao entre poupanga e renda nos Estados Unidos, no periodo de 
1970-1995. Dividimos o periodo da amostra em dois, 1970-1981 e 1982-1995, e mostramos com base no 
teste de Chow que havia uma diferenga na regressao da poupanga sobre a renda entre os dois perfodos. 

Entretanto, nao podfamos apontar se a diferenga nos dois regressores devia-se as diferengas nos 
termos de intercepto ou aos coeficientes angulares, ou a ambos. Com muita frequencia esse conheci- 
mento e muito util. Quanto as Equagoes (8.7.1) e (8.7.2), vemos que ha quatro possibilidades, que 
ilustraremos na Figura 9.3: 

1. Tanto o intercepto quanto os coeficientes angulares sao iguais nas duas regressoes. Este caso 
de regressoes coincidentes e apresentado na Figura 9.3a. 

2. Somente os interceptos nas duas regressoes sao diferentes, mas os coeficientes angulares sao 
iguais. Este e o caso de regressoes paralelas, apresentado na Figura 9.3 b. 

3. Os interceptos nas duas regressoes sao iguais, mas os coeficientes angulares sao diferentes. 
Esta e a situagao das regressoes concorrentes (Figura 9.3c). 

4. Ambos os interceptos e coeficientes angulares nas duas regressoes sao diferentes. Este e o 
caso de regressoes dissimilares, apresentado na Figura 9.3 d. 

O procedimento do teste de Chow, que envolve varias etapas, discutido na Segao 8.7, informa apenas 
se duas (ou mais) regressoes sao diferentes sem dizer qual a origem da diferenga. A origem da diferenga, 
se houver, pode ser identificada combinando-se todas as observagoes (26 ao todo) e efetuando-se apenas 
uma regressao multipla, como apresentado a seguir: 10 


FIGURA 9.3 

Regressoes poupanga- 
-renda plausfveis. 


Y t - o'] + o^ 2 F)/ + P\X t + fa(D,X t )+ u t (9.5.1) 

Poupanga Poupanga 




(a) Regressoes coincidentes ( h) Regressoes Paralelas 


Poupanga 




( d ) Regressoes dissimilares 


9 O material desta segao baseia-se nos artigos do autor, "Use of dummy variables in testing for equality between 
sets of coefficients in two linear regressions: a note" e "Use of dummy variables... a generalization", ambos 
publicados em American Statistician, 1970. v. 24, n. 1 e 5, p. 50-52 e 18-21. 

10 Como mostra o teste de Chow, a tecnica de combinagao pressupoe a homocedasticidade, isto e, a\ — a\ — a 2 . 



















Capftulo 9 Modelos de regressao com variaveis bindrias (dummies) 297 


em que Y — poupanga 
X = renda 
t — tempo 

D = 1, para observagoes em 1982-1995 
= 0, caso contrario (para observances em 1970-1981) 

A Tabela 9.2 mostra a estrutura da matriz de dados. Para ver as implicagoes da Equagao (9.5.1), 
e, supondo, como usual, que £(m,) = 0, obtemos: 

Fungao poupanga media para 1970-1981: 

E(Y t | D, = 0, X t ) = cki + PiX, (9.5.2) 


Fungao poupanga media para 1982-1995: 

E{Y t \D t = 1, X t ) = (ai + a 2 ) + (ft + ft)*, ( 9 . 5 . 3 ) 


TABELA 9.2 

Dados sobre 
poupanga e renda, 
Estados Unidos, 
1970-1995 


Observagao 

Poupanga 

Renda 

Variavel dummy 

1970 

61 

727,1 

0 

1971 

68,6 

790,2 

0 

1972 

63,6 

855,3 

0 

1973 

89,6 

965 

0 

1974 

97,6 

1054,2 

0 

1975 

104,4 

1159,2 

0 

1976 

96,4 

1273 

0 

1977 

92,5 

1401,4 

0 

1978 

112,6 

1580,1 

0 

1979 

130,1 

1769,5 

0 

1980 

161,8 

1973,3 

0 

1981 

199,1 

2200,2 

0 

1982 

205,5 

2347,3 

1 

1983 

167 

2522,4 

1 

1984 

235,7 

2810 

1 

1985 

206,2 

3002 

1 

1986 

196,5 

3187,6 

1 

1987 

168,4 

3363,1 

1 

1988 

189,1 

3640,8 

1 

1989 

187,8 

3894,5 

1 

1990 

208,7 

4166,8 

1 

1991 

246,4 

4343,7 

1 

1992 

272,6 

4613,7 

1 

1993 

214,4 

4790,2 

1 

1994 

189,4 

5021,7 

1 

1995 

249,3 

5320,8 

1 


Nota: variavel dummy = 1 para observances iniciadas em 1982; 0 para outras datas. Os dados sobre poupanga e renda estao 
em bilhoes de dolares. 

Fonte: Economic Report of the President, 1997, Tabela B-28, 


O leitor notara que estas sao as mesmas fungoes que as Equagoes (8.7.1) e (8.7.2), com a, = aj, 
A .2 = /?i, Y\ — (ai + a 2 ), e y 2 — (/Si + ft). Portanto, calcular a Equagao (9.5.1) equivale a estimar as 
duas fungoes de poupanga individuals nas Equagoes (8.7.1) e (8.7.2). 

Na Equagao (9.5.1), a 2 eo intercepto diferencial, como anteriormente, efteo coeficiente an¬ 
gular diferencial (tambem chamado de deslocador do coeficiente angular), indicando quanto o 
coeficiente angular da fungao poupanga do segundo periodo (a categoria que recebe o valor binario 
de 1) difere daquele do primeiro periodo. Note quanto a introdugao da variavel binaria D na forma 
interativa ou multiplicativa ( D multiplicado por X) pemiite diferenciar entre os coeficientes angu- 
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lares dos dois perfodos, assim como a introdugao da variavel binaria na forma aditiva permitiu dis- 
tinguir entre os interceptos dos dois perfodos. 


EXEMPLO 9.4 

Diferengas 
estruturais na 
regressao 
poupanga-renda 
nos Estados 
Unidos, a 
abordagem da 
variavel binaria 


Antes de prosseguirmos, vamos apresentar os resultados da regressao do modelo (9.5.1) 
aplicado aos dados de poupanga-renda dos Estados Unidos. 

Y t - 1,0161 + 152,4786D t + 0,0803X t - 0,0655 (D t X t ) 

ep= (20,1648) (33,0824) (0,0144) (0,0159) 

t= (0,0504)** (4,6090)* (5,5413)* (-4,0963)* 

R 2 = 0,8819 

em que * indica valores p menores que 5% e ** indica valores p superiores a 5%. 

Como mostram esses resutados da regressao, tanto o intercepto diferencial quanto os 
coeficientes angulares sao estatisticamente significativos, sugerindo que as regressoes pou¬ 
panga-renda para os dois perfodos de tempo sao diferentes, como na Figura 9.3 d. 

Da Equagao (9.5.4), podemos derivar as Equagoes (9.5.2) e (9.5.3), que sao: 

Regressao poupanga-renda, 7 970-1981 

Y t = 1,0161 + 0,0803X t (9.5.5) 


Regressao poupanga-renda, 1982-1995 

? t = (1,0161 + 152,4786) + (0,0803 - 0,0655)X t >5 

= 153,4947+ 0,0148X t ' ‘ ' ’ 

Estes sao exatamente os resultados obtidos nas Equagoes (8.7.1a) e (8.7.2a), que nao 
deveriam surpreender. Estas regressoes ja sao mostradas na Figura 8.3. 

As vantagens do metodo de variaveis binarias (estimar a Equagao (9.5.1)) sobre o teste 
de Chow (estimar as tres regressoes (8.7.1), (8.7.2), e (8.7.3)) agora podem ser vistas dire- 
tamente: 


1. Precisamos efetuar apenas uma regressao porque as regressoes individuals podem ser 
derivadas facilmente dela, da maneira indicada pelas equagoes (9.5.2) e (9.5.3). 

2. A regressao simples (9.5.1) pode ser usada para testar diversas hipoteses. Se o coefi- 
ciente do intercepto diferencial a 2 for nao significativo estatisticamente, podemos acei- 
tar a hipotese de que as duas regressoes tern o mesmo intercepto; as duas regressoes 
sao concorrentes (veja a Figura 9.3c). Da mesma forma, se o coeficiente diferencial an¬ 
gular f$ 2 for nao significativo estatisticamente, mas u 2 for significativo, podemos nao 
rejeitar a hipotese de que as duas regressoes tern a mesma inclinagao; as duas retas de 
regressao sao paralelas (veja a Figura 9.3 b). O teste da estabilidade de toda a regressao 
( a 2 = p 2 = 0, simultaneamente) pode ser feito pelo teste F usual (lembre-se do teste F 
de mfnimos quadrados restritos). Se essa hipotese nao for rejeitada, as retas de regres¬ 
sao serao coincidentes, como mostra a Figura 9.3 a. 

3. O teste de Chow nao nos diz explicitamente quais coeficientes, o intercepto ou os angu¬ 
lares (como no exemplo), ou ambos, sao diferentes nos dois perfodos. Ou seja, pode-se 
obter um teste de Chow significativo, porque apenas o coeficiente angular e diferente 
ou apenas o intercepto e diferente ou ambos sao diferentes. Em outras palavras, nao 
podemos dizer, pelo teste de Chow, qual das quatro possibilidades descritas na Figura 
9.3 ocorre em determinado exemplo. Nesse sentido, a abordagem da variavel binaria 
tern uma vantagem distinta, pois ela nao so diz se os dois sao diferentes, mas identi- 
fica as origens da diferenga — seja ela devida ao intercepto ou ao coeficiente angular ou 
a ambos. Na pratica, saber que as duas regressoes diferem neste ou naquele coeficiente 
e tao importante quanto, se nao for mais, saber que eles sao diferentes. 

4. Por fim, uma vez que a combinagao (incluir todas as observagoes em uma regressao) 
aumenta os graus de liberdade, ela pode melhorar a exatidao relativa aos parametros 
estimados. Evidentemente, lembre-se de que toda adigao de uma variavel binaria con- 
sumira um grau de liberdade. 
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9.6 Efeitos de intera^ao usando variaveis dummies 

As variaveis binarias sao uma ferramenta flexivel que pode lidar com uma variedade de proble- 
mas interessantes. Para tanto, considere o seguinte modelo: 

Yj - a i + a 2 D 2 i + a 2 D 2i + fiXt + u, (9.6.1) 

em que Y = salario por hora em dolares 

X = escolaridade (anos de estudo) 

D 2 = 1 se for mulher, 0 se for homem 

D 3 = 1 se for nao branco e nao hispanico, 0 nos demais casos 

Neste modelo, genero e raga sao regressores qualitativos e a escolaridade e um regressor quanti¬ 
tative. 11 No modelo esta implfcito o pressuposto de que o efeito diferencial da variavel binaria D 2 e 
constante nas categorias de raga e o efeito diferencial da raga £) 3 tambem e constante entre os dois 
generos. Em outras palavras, se o salario medio for mais alto para homens que para mulheres, tal fato 
acontecera independentemente de serem nao brancos/nao hispanicos. Da mesma forma, se, por exem- 
plo, nao brancos e nao hispanicos tiverem salarios medios mais baixos, isso acontecera independen¬ 
temente de serem homens ou mulheres. 

Em muitas aplicagoes esse pressuposto pode nao ser respeitado. Uma mulher nao branca/nao his¬ 
panica pode ganhar salarios mais baixos que um homem nao branco/nao hispanico. Pode haver inte- 
racao entre as duas variaveis qualitativas D 2 e l)\. O efeito delas sobre Y medio pode nao ser aditivo 
como na Equa§ao (9.6.1), mas tambem multiplicativo, como no modelo a seguir: 

Yj = a i + tf 2 D 2 , + D 2i + a A (Dh D 2l ) + [IX, + u, (9.6.2) 

em que as variaveis sao como definidas para o modelo (9.6.1). 

Da Equa 5 ao (9.6.2), obtemos: 


E(Y t | D 2i = 1, £> 3 , = 1, Xi) = (ai + a 2 + a 3 + a 4 ) + fiX, (9.6.3) 


que e a fumjao salario medio por hora para mulher nao branca/nao hispanica. Observe que 

a 2 — efeito diferencial de ser uma mulher 

« 3 = efeito diferencial de ser nao branco/nao hispanico 

a 4 = efeito diferencial de ser mulher nao branca/nao hispanica 

o que mostra que os salarios medios por hora de mulheres nao brancas/nao hispanicas e diferente 
(por q! 4 ) dos salarios medios por hora de mulheres ou nao brancos/nao hispanicos. Se, por exemplo, 
todos os tres coeficientes binarios diferenciais forem negativos, isso implicaria que mulheres nao 
brancas/nao hispanicas que trabalham ganham salarios medios por hora muito mais baixos com- 
parados a categoria-base, o que no exemplo sao homens brancos ou hispanicos. 

Agora o leitor pode entender como a interagao binaria (o produto de duas variaveis binarias ou 
qualitativas) modifica o efeito dos dois atributos considerados individualmente (aditivamente). 


n 


Se tivessemos de definir escolaridade como primeiro grau incompleto, primeiro grau completo e acima de 
primeiro grau, poderfamos usar duas variaveis binarias para representar as tres classes. 
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EXEMPLO 9.5 

Ganhos medios 
porhornem 
relagao a 
escolaridade, 
genero e raga 


Primeiro vamos apresentar os resultados de regressao baseados no modelo (9.6.1). 
Usando os dados empregados para estimar a regresao (9.3.1), obtivemos os seguintes 
resultados: 


Y)= - 0,2610 - 2,360602,- 1,7327D 3 ,+ 0,8028X, 

t= (-0,2357)** (-5,4873)* (-2,1803)* (9,9094)* (9.6.4) 

R 2 = 0,2032 n = 528 


em que * indica os valores p menores que 5% e ** indica os valores p maiores que 5%. 

O leitor pode verificar que os coeficientes diferencias de intercepto sao estatisticamente 
significativos, se tem os sinais esperados (por que?) e se a escolaridade apresenta um forte 
efeito positivo no salario por hora, uma constatagao nao surpreendente. 

Como mostra a Equagao (9.6.4), ceteris paribus, os ganhos medios por hora de mulheres 
sao cerca de $ 2,36 mais baixos, e os ganhos medios por hora de trabalhadores nao brancos/ 
nao hispanicos tambem sao cerca de $ 1,73 mais baixos. 

Agora considere os resultados do modelo (9.6.2), que incluem a variavel binaria de inte- 
ragao: 


%= - 0,26100 - 2,3606D 2 , - 1,7327D 3 , + 2,1289D 2 ,D 3 , + 0,8028X, 

t= (-0,2357)** (-5,4873)* (-2,1803)* (1,7420)** (9,9095)** ^ ^ 

R 2 = 0,2032 n = 528 

em que * indica valores p inferiores a 5% e ** indica valores p superiores a 5%. 

Como se pode ver, as duas variaveis binarias aditivas ainda sao estatisticamente significa- 
tivas, mas a variavel binaria interativa nao esta no nfvel convencional de 5%; o valor p real da 
variavel binaria de interagao e de cerca de 8%. Se consideramos que essa e uma probabilida- 
de suficientemente baixa, os resultados da Equagao (9.6.5) podem ser interpretados como se 
segue: mantendo o nfvel de escolaridade constante, se acrescentarmos os tres coeficientes de 
variavel dummy, obteremos: —1,964 (= —2,3605 — 1,7327 + 2,1289), o que significa que 
os salarios medios por hora de mulheres nao brancas/nao hispanicas e inferior em cerca de 
$ 1,96, que esta entre o valor de —2,3605 (apenas a diferenga de genero) e —1,7327 (apenas 
a diferenga de raga). 


O exemplo anterior revela claramente o papel das variaveis binarias de interagao quando dois ou 
mais regressores sao incluidos no modelo. E importante notar que no modelo (9.6.5) estamos pressu- 
pondo que a taxa de aumento dos ganhos por hora com respeito a escolaridade (de cerca de 80 centa¬ 
vos por ano adicional de escolaridade) permanece constante entre genero e raga, mas pode nao ser 
esse o caso. Se quisermos testar isso, teremos de introduzir coeficientes angulares diferenciais (veja 
o Exercfcio 9.25). 

9.7 O uso de variaveis dummies na analise sazonal 


Muitas series temporais baseadas em dados mensais ou trimestrais exibem padroes sazonais (mo- 
vimentos oscilatorios regulares). Exemplos sao as vendas de lojas de departamentos no Natal ou em 
outros dias importantes, a demanda por dinheiro (ou saldos) pelas famflias em datas comemorativas, 
a demanda de sorvete e refrigerantes durante o verao, pregos das safras logo depois da temporada de 
colheita, a demanda por viagens aereas etc. Com frequencia, e desejavel remover o fator sazonal, ou 
componente, de uma serie temporal de modo que se possa concentrar nos demais componentes, como a 
tendencia. 12 O processo de remover o componente sazonal de uma serie temporal e conhecido como 
dessazonalizagao ou ajustamento sazonal, e a serie temporal assim obtida e chamada serie tempo¬ 
ral dessazonalizada, ou ajustada sazonalmente. Series temporais importantes economicamente. 


12 


Uma serie temporal pode conter quatro componentes: (1) sazonal, (2) ciclico, (3) tendencia e (4) estrita- 
mente aleatorio. 
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como a taxa de desemprego, o indice de pre?os ao consumidor (IPC), o indice de pre?os do produtor 
(IPP) e o indice de produ?ao industrial, em geral sao publicadas na forma sazonal ajustada. 

Existem varios metodos para dessazonalizar uma serie temporal, mas consideraremos apenas um 
deles: o metodo de varidveis bindrias , 13 Para ilustrar como as variaveis binarias podem ser usadas 
para dessazonalizar series temporais economicas, considere os dados da Tabela 9.3. Nela sao apresen- 
tados dados trimestrais para os anos de 1978-1995 sobre a venda de quatro eletrodomesticos: lavado- 
ras de pratos, trituradores de lixo, lavadoras de roupas e geladeiras, todos em milhares de unidades. 
A tabela tambem apresenta dados sobre despesa com bens duraveis em bilhoes de $ de 1982. 


TABELA 9.3 

LAV 

TRIT 

GEL 

ROUP 

DUR 

LAV 

TRIT 

GEL 

ROUP 

DUR 

Dados trimestrais 

sobre vendas de 

eletrodomesticos 

841 

798 

1317 

1271 

252,6 

480 

706 

943 

1036 

247,7 

957 

837 

1615 

1295 

272,4 

530 

582 

1175 

1019 

249,1 

999 

821 

1662 

1313 

270,9 

557 

659 

1269 

1047 

251,8 

(em milhares) e 

960 

858 

1295 

1150 

273,9 

602 

837 

973 

918 

262 

despesas com bens 

894 

837 

1271 

1289 

268,9 

658 

867 

1102 

1137 

263,3 

duraveis ( 1 ° 

851 

838 

1555 

1245 

262,9 

749 

860 

1344 

1167 

280 

trimestre de 1978 

863 

832 

1639 

1270 

270,9 

827 

918 

1641 

1230 

288,5 

ao 4° trimestre de 

878 

818 

1238 

1103 

263,4 

858 

1017 

1225 

1081 

300,5 

1985) 

792 

868 

1277 

1273 

260,6 

808 

1063 

1429 

1326 

312,6 

589 

623 

1258 

1031 

231,9 

840 

955 

1699 

1228 

322,5 


657 

662 

1417 

1143 

242,7 

893 

973 

1749 

1297 

324,3 

699 

822 

1185 

1101 

248,6 

950 

1096 

1117 

1198 

333,1 

675 

871 

1196 

1181 

258,7 

838 

1086 

1242 

1292 

344,8 

652 

791 

1410 

1116 

248,4 

884 

990 

1684 

1342 

350,3 

628 

759 

1417 

1190 

255,5 

905 

1028 

1764 

1323 

369,1 

529 

734 

919 

1125 

240,4 

909 

1003 

1328 

1274 

356,4 


Nota: LAV = lavadora de pratos; TR1T = triturador de lixo; REFR = refrigerador; ROUP = lavadora de roupas; DUR = despesas com 
bens duraveis, bilhoes de dolares de 1982. 

Fonte: Business Statistics and Survey of Current Business, Department of Commerce (varios numeros). 


Para ilustrar a tecnica das variaveis binarias, consideremos apenas as vendas de geladeiras no perfo- 
do de amostra; mas primeiro vamos examinar os dados da Figura 9.4. Ela sugere que talvez haja um 
padrao sazonal nos dados associados aos varios trimestres. Para tanto, considere o modelo a seguir: 

Y t = a\D\, + OLiDit + oiitDit + 014 D 4 , + u t (9.7.1) 


em que Y, — vendas de geladeiras (em milhares) e os D sao as variaveis binarias, assumindo o 
valor de 1 no trimestre relevante e 0 nos demais. Observe que, para evitar a armadilha das 
varidveis dummies, estamos atribuindo uma varidvel dummy para cada trimestre do ano, mas 
omitindo o termo de intercepto. Se houver qualquer efeito sazonal em dado trimestre, isso sera 
indicado por um valor t estatisticamente significativo do coeficiente binario associado a esse tri¬ 
mestre. 14 

Note que na Equagao (9.7.1) estamos fazendo a regressao de Y efetivamente contra um intercepto, 
exceto que permitimos um intercepto diferente em cada temporada (trimestre). Como resultado, o 
coeficiente binario de cada trimestre dara as vendas medias de geladeiras em cada trimestre ou tem¬ 
porada (por que?). 


13 Sobre os varios metodos de ajuste sazonal, veja, por exemplo, DIEBOLD, Francis X. Elements of forecasting. 2. 
ed. South-Western Publishing, 2001. cap. 5. 

u Vale fazer referenda a um aspecto tecnico. Este metodo de atribuir uma variavel dummy a cada trimestre supoe 
que o fator sazonal, se presente, e deterministico e nao estocastico. Voltaremos a esse ponto quando discutir- 
mos econometria de series temporais na Parte 5 do livro. 
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FIGURA 9.4 

Vendas de geladeiras, 

1978-1985 

(trimestrais). 


EXEMPLO 9.6 

Sazonalidade na 
venda de 
geladeiras 


TABELA 9.4 

Venda (trimestrais) 
de refrigeradores 
(em milhares de 
unidades), 
1978-1985 



Dos dados sobre venda de geladeira apresentados na Tabela 9.4, obtemos os seguintes 
resultados: 


?,= 1.222,125 D lt + 1.467,500D 2t + 1.569,750D 3t + 1.160,000D 4t 
t= (20,3720) (24,4622) (26,1666) (19,3364) (9.7.2) 

R 2 = 0,5317 

Nota: nao apresentamos os erros padrao dos coeficientes estimados, ja que cada erro 
padrao e igual a 59,9904, porque todas as variaveis binarias assumem apenas um valor de 1 
ou zero. 

Os coeficientes a estimados na Equagao (9.7.2) representam as vendas medias de refrige¬ 
radores (em milhares de unidades) em cada temporada (trimestre). A venda media de refri¬ 
geradores no primeiro trimestre, em milhares de unidades, e cerca de 1.222, no segundo 
trimestre e de aproximadamente 1.468, no terceiro trimestre e cerca de 1.570 e no quarto, 
aproximadamente 1.160. 


REFR 

DUR 

d 2 

D 3 

d 4 

REFR 

DUR 

o 2 

D 3 

d 4 

1317 

252,6 

0 

0 

0 

943 

247,7 

0 

0 

0 

1615 

272,4 

1 

0 

0 

1175 

249,1 

1 

0 

0 

1662 

270,9 

0 

1 

0 

1269 

251,8 

0 

1 

0 

1295 

273,9 

0 

0 

1 

973 

262,0 

0 

0 

1 

1271 

268,9 

0 

0 

0 

1102 

263,3 

0 

0 

0 

1555 

262,9 

1 

0 

0 

1344 

280,0 

1 

0 

0 

1639 

270,9 

0 

1 

0 

1641 

288,5 

0 

1 

0 

1238 

263,4 

0 

0 

1 

1225 

300,5 

0 

0 

1 

1277 

260,6 

0 

0 

0 

1429 

312,6 

0 

0 

0 

1258 

231,9 

1 

0 

0 

1699 

322,5 

1 

0 

0 

1417 

242.7 

0 

1 

0 

1749 

324,3 

0 

1 

0 

1185 

248,6 

0 

0 

1 

1117 

333,1 

0 

0 

1 

1196 

258,7 

0 

0 

0 

1242 

344,8 

0 

0 

0 

1410 

248,4 

1 

0 

0 

1684 

350,3 

1 

0 

0 

1417 

255,5 

0 

1 

0 

1764 

369.1 

0 

1 

0 

919 

240,4 

0 

0 

1 

1328 

356,4 

0 

0 

1 


Nota: REFR = Refrigeradores. 

DUR = despesas com bens duraveis. 

D 2 = 1 para o segundo trimestre, 0 nos demais. 

D 2 = 1 para o terceiro trimestre, 0 nos demais. 

Z) 4 = 1 para o quarto trimestre, 0 nos demais. 

( Continua ) 








Capftulo 9 Modelos de regressao com variaveis binarias (dummies) 303 


EXEMPLO 9.6 

( Continuagao ) 


Em vez de atribuirmos uma variavel dummy para cada trimestre e suprimir o termo de 
intercepto a fim de evitar a armadilha das variaveis binarias, poderfamos atribuir apenas tres 
variaveis e incluir o termo de intercepto. Suponhamos que o primeiro trimestre seja tornado 
como referenda e que sejam atribufdas variaveis binarias ao segundo, terceiro e quarto tri¬ 
mestre. Isso levara aos resultados da regressao (veja a Tabela 9.4): 


Y, = 1.222,1250 + 245,3750D 2 f + 347,6250D 3t - 62,1250D 4( 
t= (20,3720)* (2,8922)* (4,0974)* (-0,7322)** (9.7.3) 

R 2 = 0,5318 


em que * indica valores menores que 5% e ** indica valores maiores que 5%. 

Ja que estamos considerando o primeiro trimestre como referenda, os coeficientes ligados 
as diversas variaveis binarias agora sao interceptos diferenciais, mostrando quanto o valor me¬ 
dio de Y no trimestre cuja variavel binaria recebe o valor 1 difere do trimestre de referenda. 
Em outras palavras, os coeficientes das variaveis binarias sazonais darao aumento ou diminuigao 
sazonal ao valor medio de Y em rela^ao ao perfodo de base. Se acrescentarmos os diversos 
valores do intercepto diferencial ao valor medio referencial de 1.222,125, sera obtido o valor 
medio para os diversos trimestres. Desse modo, reproduziremos exatamente a Equa^ao 
(9.7.2), desprezando os erros de arredondamento. 

Mas agora veremos que vale tratar um trimestre como referenda, pois a Equag:ao (9.7.3) 
mostra que o valor medio de Y para o quarto trimestre nao e estatisticamente diferente do 
valor medio para o primeiro trimestre; o coeficiente da variavel binaria para o quarto trimes¬ 
tre nao e estatisticamente significativo. E claro que a resposta mudara, dependendo do tri¬ 
mestre tratado como referenda, mas a conclusao geral nao mudara. Como obtemos a serie 
dessazonalizada das vendas de refrigeradores? Isso pode ser feito facilmente. Estimamos, 
com base no modelo (9.7.2) (ou (9.7.3)) os valores de Y para cada observa^ao e subtrafmos 
deles os valores efetivos de V, ou seja, obtemos ( Y t — Y t ) que sao apenas os resfduos da regres¬ 
sao (9.7.2). Eles estao na Tabela 9.5. 15 

A esses resfduos, temos de adicionar a media da serie Y a fim de obtermos os valores 
previstos. 

O que esses resfduos representam? Os componentes restantes da serie temporal de refrige¬ 
radores: os componentes de tendencia, cfclicos e aleatorios (mas deve-se considerar a adverten- 
cia feita na nota de rodape 15). 

Uma vez que os modelos (9.7.2) e (9.7.3) nao contem covariaveis, o quadro mudara se 
incluirmos um regressor quantitative no modelo? Como os gastos com bens duraveis tern 
uma influencia importante sobre a demanda por refrigeradores, expandiremos nosso mode¬ 
lo (9.7.3) para incluir essa variavel. Os dados para gastos com bens duraveis em bilhoes de 
dolares de 1982 ja sao apresentados na Tabela 9.3. Esta e nossa variavel (quantitativa) X no 
modelo. Os resultados da regressao sao os seguintes: 

Y t = 456,2440 + 242,4 976D 2t + 325,2643D 3t - 86,0804D 4( + 2,7734X t 
t= (2,5593)* (3,6951)* (4,9421)* (-1,3073)** (4,4496)* (9.7.4) 

R 2 = 0,7298 

em que * indica valores menores que 5% e ** indica valores maiores que 5%. 

( Continua ) 


15 Evidentemente, isto pressupoe que a tecnica das variaveis binarias seja um metodo apropriado de dessazonali- 
zar uma serie temporal (ST) e que esta ST pode ser representada por ST = s+ c+ t+u, em que s, representa 
o componente sazonal, c, o cfclico, t, o de tendencia eu,o componente aleatorio. Contudo, se a serie temporal for 
da forma ST = (s)(c)(t)(u), em que os quatro componentes entram de forma multiplicaiva, o metodo de dessazona- 
lizapao que acabamos de apresentar sera inadequado, pois pressupoe que os componentes da serie temporal sejam 
aditivos. Falaremos mais sobre o assunto nos capftulos a respeito de econometria das series temporais. 
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EXEMPLO 9.6 TABELA 9.5 Regressao de vendas de refrigeradores: valores observados, ajustados e resfduos (Equaeao 
(' Continuagao ) 9.7.3) 


Grafico dos resfduos 



Observados 

Ajustados 

Resfduos 

( 


1978-1 

1317 

1222,12 

94,875 


* 

1978-11 

1615 

1467,50 

147,500 


* 

1978-111 

1662 

1569,75 

92,250 


* 

1978-IV 

1295 

1160,00 

1 35,000 


* 

1979-1 

1271 

1222,12 

48,875 


* 

1979-11 

1555 

1467,50 

87,500 


* 

1979-111 

1639 

1569,75 

69,250 


* 

19 79-1V 

1238 

1160,00 

78,000 


★ 

1980-1 

1277 

1222,12 

54,875 


* 

1980-11 

1258 

1467,50 

-209,500 

* 


1980-111 

1417 

1569,75 

-152,750 

t 


1980-IV 

1185 

1160,00 

25,000 


* 

1981-1 

1196 

1222,12 

-26,125 

* 


1981-11 

1410 

1467,50 

-57,500 

* 


1981-111 

1417 

1569,75 

-152,750 

* 


1981-IV 

919 

1160,00 

-241,000 

*. 


1982-1 

943 

1222,12 

-279,125 

* 


1982-11 

1175 

1467,50 

-292,500 

* 


1982-111 

1269 

1569,75 

-300,750 

* 


1982-IV 

973 

1160,00 

-187,000 

*. 


1983-1 

1102 

1222,12 

-120,125 

* 


1983-11 

1344 

1467,50 

-123,500 



1983-111 

1641 

1569,75 

71,250 


* 

1983-IV 

1225 

1160,00 

65,000 


* 

1984-1 

1429 

1222,12 

206,875 


. * 

1984-11 

1699 

1467,50 

231,500 


* 

1984-111 

1749 

1569,75 

179,250 


* 

1984-IV 

1117 

1160,00 

-43,000 

* 


1985-1 

1242 

1222,12 

19,875 


* 

1985-11 

1684 

1467,50 

216,500 


* 

1985-111 

1764 

1569,75 

194,250 


* 

1985-IV 

1328 

1160,00 

168,000 


* 


- 0 + 


Novamente, deve-se lembrar que estamos tratando o primeiro trimestre como base. 
Como na Equaeao (9.7.3), vemos que os coeficientes de intercepto diferenciais para o segun- 
do e o terceiro trimestres sao estatisticamente diferentes daquele do primeiro trimestre, mas 
os interceptos do quarto e primeiro trimestres sao estatisticamente iguais. O coeficiente de X 
(gastos com bens duraveis) de aproximadamente 2,77 diz que, descontando os efeitos sazo- 
nais, se os gastos com bens duraveis aumentam em um dolar, em media, as vendas de refri¬ 
geradores sobem em cerca de 2,77 unidades, aproximadamente 3 unidades; lembre-se de 
que os refrigeradores estao em mil unidades e X esta em bilhoes de dolares (1982). 


( Continua ) 
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EXEMPLO 9.6 

( Continuagao) 


Cabe, aqui, fazer uma pergunta: visto que as vendas de refrigeradores exibem padroes 
sazonais, os gastos com bens duraveis exibiriam tambem padroes sazonais? Como levamos 
em conta a sazonalidade em X? O interessante na Equagao (9.7.4) e que as variaveis binarias 
naquele modelo nao so removem a sazonalidade em /, mas tambem a sazonalidade em X, 
se houver. (Isso decorre de um teorema de estatfstica conhecido como teorema de Frisch- 
-Waugh . 16 Podemos dizer que matamos (dessazonalizamos) dois coelhos (duas series) com 
uma cajadada so (a tecnica de variaveis binarias). 


Para apresentarmos uma demonstragao informal dessa afirmagao, sigamos estas eta- 
pas: (1) efetuamos a regressao de Y contra as variaveis binarias como na Equagao (9.7.2) 
ou na (9.7.3) e guardamos os resfduos, por exemplo, Sp estes representam Y dessazona- 
lizado; (2) efetuamos uma regressao similar para X e obtemos os resfduos dela, por exem¬ 
plo, S 2 ; esses resfduos representam X dessazonalizado; e (3) calculamos a regressao de St 
contra S 2 . Veremos que o coeficiente angular nessa regressao e exatamente o coeficiente 
de X na regressao (9.7.4). 


9.8 Regressao linear segmentada 


Para ilustrar mais um emprego das variaveis binarias, considere a Figura 9.5, que mostra como 
uma empresa hipotetica remunera seus representantes de vendas. Ela paga comissoes com base em 
vendas de modo que ate certo nfvel, o nfvel meta, ou limiar, X*, ha uma estrutura estocastica de co¬ 
missoes, e, para vendas acima desse ponto, paga outra comissao. ( Nota: alem das vendas, outros fa- 
tores afetam a comissao. Suponha que esses outros fatores sejam representados pelo termo de erro 
estocastico.) Especificamente, pressupoe-se que a comissao de vendas aumente linearmente com as 
vendas ate o limiar X*, apos o qual continua a aumentar linearmente com as vendas, mas a uma taxa 
muito mais acentuada. Temos uma regressao linear segmentada consistindo em dois segmentos ou 
trechos, rotulados I e II na Figura 9.5, e a fungao de comissao muda sua inclinagao no valor limiar. 
Tendo os dados sobre comissao, vendas e o valor do limiar X*, a tecnica de variaveis binarias pode 
ser usada para estimar os coeficientes angulares (diferentes) dos dois segmentos da regressao linear 
segmentada da Figura 9.5. Procedemos da seguinte forma: 


FIGURA 9.5 

Relagao hipotetica 
entre comissao e 
volume de vendas. 
{Nota: o intercepto no 
eixo Y denota 
comissao minima 
garantida.) 


Yi = «i + frXi + p 2 (X, - X*)D t + u, 


(9.8.1) 


Y 



X (vendas) 


16 Para ver a demonstragao, consulte DARNELL, adrian C. A dictionary of econometrics. Lyme, reino unido: Edqard 
Elgar, 1995. p. 150-152. 
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em que Y • = comissao de vendas 

X, — volume de vendas geradas pelo vendedor 

X* — limiar de vendas, tambem chamado de no (conhecido de antemao) 17 
£> = 1 se Xj > X* 

= 0 se X, < X* 


Supondo E (itj) — 0, vemos imediatamente que 

E(Y t | A = 0, Xi,X*) = «i + PiXi (9.8.2) 


que da a comissao media de vendas ate o nfvel meta X* e 

E(Y, | A = 1, X u X *) = ai - p 2 X* + (Pi + p 2 )X t (9. 8 .3) 


que da a comissao media de vendas alem do nfvel meta X*. 

Assim, Pi da o coeficiente angular da linha de regressao no segmento I e P\+ P 2 , o coeficiente 
angular no segmento II da regressao linear segmentada da Figura 9.5. Um teste da hipotese de que 
nao ha quebra na regressao ao valor limiar X* pode ser conduzido facilmente, notando-se a signifi- 
cancia estatistica do coeficiente angular diferencial estimado p 2 (veja a Figura 9.6). 

A proposito, a regressao linear fragmentada que acabamos de discutir e o exemplo de uma classe 
mais geral de fu^bes conhecidas como fun^oes spline. 18 


FIGURA 9.6 

Pai'ametros da 
regressao linear 
segmentada. 


Y 



X (vendas) 


17 Entretanto, o limiar pode nao estar sempre evidente. Uma abordagem ad hoc e representar graficamente a 
variavel dependente contra a(s) variavel(is) explanatoria(s) e observar se parece haver uma mudanga acentuada 
na relafao apos um dado valor de X (X*). Uma abordagem analitica para encontrar o ponto de quebra pode 
ser vista nos chamados modelos de regressao com mudanfa, mas esse ainda e um topico avamjado. Essa 
discussao pode ser encontrada em FOMBY, Thomas; HILL, R. Carter; JOHNSON, Stanley. Advanced econometric 
methods. Nova York: Springer-Verlag, 1984. cap. 14. 

18 Para uma discussao acesslvel sobre splines (polinomios segmentados de ordem k), veja Montgomery, Douglas 
C.; Peck, Elizabeth A.; VINING, G. Geoffrey. Introduction to linear regression analysis. 3. ed. Nova York: John 
Wiley & Sons, 2001. p. 228-230. 
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EXEMPLO 9.7 

Custo total em 
relagao a 
produgdo 


Como exemplo da aplicafao da regressao linear segmentada, considere a relagao hipote- 
tica entre custo total e producao dada na Tabela 9.6. Sabe-se gue o custo total pode mudar 
seu coeficiente angular quando a producao atinge 5.500 unidades. 

Seja Y, na Equa^ao (9.8.4), o custo total e X a producao total, obtemos os seguintes resul- 
tados: 


Y, = - 145,72 + 0,2791 X, + 

t= (-0,8245) (6,0669) 

R 2 = 0,9737 


0,0945(X, - X*)D, 
(1,1447) 

X* = 5,500 


(9.8.4) 


Como mostram os resultados, o custo marginal de produgao e cerca de 28 centavos de 
dolar por unidade, e, embora atinja 37 centavos (28 + 9) para uma producao de 5.500 uni¬ 
dades, a diferen^a entre os dois nao e estatisticamente significativa, porque a variavel binaria 
nao e significativa, por exemplo, no nfvel de 5%. Para fins praticos, podemos fazer a regres¬ 
sao do custo total sobre a producao total, excluindo a variavel binaria. 


TABELA 9.6 

Dados hipoteticos 
sobre produ§ao e 
custo total 


Dolares, custo total 

256 

414 

634 

778 

1.003 

1.839 

2.081 

2.423 

2.734 

2.914 


Unidades, producao 

1.000 

2.000 

3.000 

4.000 

5.000 

6.000 

7.000 

8.000 

9.000 

10.000 


9.9 Modelos de regressao com dados em painel 

Lembre-se de que no Capftulo 1 discutimos diversos dados que estao disponfveis para analise em- 
pfrica, como cortes transversals, series temporals, dados combinados (combina 5 ao de serie temporal 
e corte transversal) e dados em painel. A tecnica de variaveis binarias pode ser facilmente estendida aos 
dados combinados e em painel. Uma vez que o uso de dados em painel esta tornando-se cada vez mais 
comum nos trabalhos aplicados, consideraremos este topico em detalhes no Capftulo 16. 


9.10 Alguns aspectos tecnicos do modelo de variaveis dummies 


A interpretagao de variaveis dummies em regressoes semilogantmicas 

No Capftulo 6 discutimos os modelos log-lineares, em que o regressando e logarftmico e os re- 
gressores sao lineares. Em tais modelos, os coeficientes angulares dos regressores dao a semielastici- 
dade, a varia§ao percentual no regressando para uma variayao unitaria do regressor. Isso so se aplica 
se o regressor for quantitative. O que acontece se um regressor for uma variavel binaria? Para sermos 
especificos, considere o seguinte modelo: 


In Yj — f i + /?2 A + u i 


(9.10.1) 


em que Y — salario-hora em $ e D — 1 para mulheres e 0 para homens. 
Como interpretamos tal modelo? Supondo que E {up — 0, obtemos: 
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Fungdo saldrio para os homens 


E{\nYi | A = 0) = ft (9.10.2) 

Fungdo saldrio para as mulheres 

£■(111 Y t | Dt = 1) = Pi + Pi (9.10.3) 

Portanto, o intercepto p l da o logaritmo medio do salario-hora e o coeficiente “angular” da a di- 
ferenpa no logaritmo medio dos ganhos por hora de homens e mulheres. Essa e uma afirmapao bas- 
tante esquisita, mas, se tomarmos o antilogaritmo de p h o que obtemos ndo sao os salarios medios 
por hora recebidos pelos homens, e sim seus salarios medianos. Como sabemos, media, mediana e 
moda sao as tres medidas de tendencia central de uma variavel aleatoria. Se tomarmos o antilogaritmo 
de (Pi + p 2 ), obtemos os salarios medianos das mulheres. 


EXEMPLO 9.8 

Logaritmo de 
salarios-hora em 
relagao a genero 


Para ilustrar a Equa^ao (9.10.1), usamos os dados do Exemplo 9.2. A regressao resulta 
com base em 528 observances, como se segue: 

ifTvj = 2,1763 - 0,2437D, 

t= (72,2943)* (-5,5048)* (9.10.4) 

R 2 = 0,0544 


em que * indica que os valores p sao praticamente nulos. 

Tomando o antilogaritmo de 2,1 763, encontramos 8,81 36 ($), que corresponde aos ga¬ 
nhos medianos por hora de homens, e tomando o antilogaritmo de [(2,1763 — 0,2437) = 
1,92857], obtemos 6,879 ($), que sao os ganhos medianos por hora recebidos pelas mulhe¬ 
res. Os ganhos medianos por hora das mulheres sao cerca de 21,94% mais baixos, compara- 
dos aos dos homens (8,81 36 — 6,879)/ 8,81 36. 

E interessante notar que podemos obter a semielasticidade para um regressor binario 
diretamente pelo dispositivo sugerido por Halvorsen e Palmquist. 19 Tomamos o antilogaritmo 
(para base e) do coeficiente binario estimado, subtrafmos 7 dele e multiplicamos a diferenga por 
7 00. (Veja o Apendice 9.A.1. para entender a logica do procedimento.) Portanto, se tomar¬ 
mos o antilogaritmo de —0,2437, obteremos 0,78366. Subtraindo 1 disso, temos —0,21 63. 
Depois de multiplicarmos por 100, obtemos —21,63%, sugerindo que o salario mediano 
das mulheres (D = 1) e 21,63% mais baixo que aquele de sua contraparte masculina, o 
mesmo que obtivemos anteriormente, salvo erros de arredondamento. 


Variaveis dummies e heterocedasticidade 

Retomemos nossa regressao de poupan§a-renda nos Estados Unidos, para os perfodos de 
1970-1981, 1982-1995 e para todo o perfodo de 1970-1995. Ao testarmos a estabilidade estrutural 
usando a tecnica das variaveis dummies, supusemos que a var (w 1; ) = var (m 2 /) = a 2 , isto e, as 
variancias dos erros nos dois perfodos eram iguais. Essa tambem era a premissa do teste de Chow. 
Se essa premissa nao for valida — se as variancias dos erros nos dois subperiodos forem dife- 
rentes —, e bem possivel tirar conclusoes equivocadas. Primeiro deve-se checar se as variancias 
no subperfodo sao iguais, usando tecnicas estatfsticas adequadas. Discutiremos esse topico com 
mais detalhes no capftulo sobre heterocedasticidade, mas, no Capftulo 8, ja descrevemos como o 


19 


HALVORSEN, Robert; PALMQUIST, Raymond. "The interpretation of dummy variables in semilogarithmic equa¬ 
tions." American Economic Review, v. 70, n. 3, p. 474-475. 
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teste Tpode ser usado com essa finalidade. 20 (Veja nossa discussao do teste de Chow no Capftulo 8.) 
Como mostramos, parece que as variancias de erro nos dois perfodos nao sao as mesmas. Dai, os 
resultados tanto do teste de Chow quanto do metodo de variaveis binarias apresentados podem 
nao ser totalmente confiaveis. Evidentemente, nosso proposito aqui e ilustrar as varias tecnicas 
que podem ser usadas para lidar com um problema (o da estabilidade estmtural). Essas tecnicas podem 
nao ser validas em qualquer aplicagao, mas isso se aplica a maioria das tecnicas estatisticas. 
Obviamente, podem-se tomar as agoes adequadas para resolver o problema, como faremos no 
capftulo sobre heterocedasticidade (mesmo assim, veja o Exercfcio 9.28). 


Variaveis binarias e autocorrelagao 

Alem da homocedasticidade, o modelo de regressao linear classico supoe que os termos de erro 
nos modelos de regressao nao estejam correlacionados. Mas o que acontece se esse nao for o caso, 
principalmente em modelos envolvendo regressores binarios? Como nos aprofundaremos na discus¬ 
sao sobre a autoccrrelagao, adiaremos a resposta a essa questao. 


O que acontece se a variavel dependente for uma variavel dummy? 

Ate aqui consideramos modelos em que o regressando e quantitative e os regressores sao 
quantitativos ou qualitativos ou ambos, mas ha ocasioes em que o regressando pode ser qualitati¬ 
ve ou binario. Considere-se, por exemplo, a decisao de um trabalhador de participar da forga de 
trabalho. A decisao de participar e do tipo sim ou nao. Portanto, a variavel participagao da forga 
de trabalho e uma variavel binaria. A decisao de participar da forga de trabalho depende de varios 
fatores, como o salario inicial, grau de escolaridade e condigoes no mercado de trabalho (medidas 
pela taxa de desemprego). 

Ainda podemos usar os minimos quadrados ordinarios (MQO) para estimar modelos de regres¬ 
sao em que o regressando e binario? Sim, mecanicamente, podemos, mas ha varios problemas 
estatfsticos que se encontram em tais modelos uma vez que ha alternativas para a estimagao dos 
MQO, discutiremos o assunto no Capftulo 15 (sobre modelos logit e probit). Naquele capftulo 
tambem discutiremos modelos em que o regressando tem mais de duas categorias; por exemplo, 
a decisao de ir para o trabalho de carro, onibus ou trem, ou a decisao de trabalhar meio perfodo, 
perfodo integral ou nao trabalhar. Tais modelos sao chamados modelos de variaveis dependen- 
tes politomicas, em contraste com os modelos de variaveis dependentes dicotomicas, em que 
a variavel dependente so tem duas categorias. 


9.11 Topicos para estudos avan^ados 


Varios topicos relacionados as variaveis binarias discutidos na literatura especifica sao bastante 
avangados, entre eles (1) modelos com parametros aleatorios ou variaveis; (2) modelos de regres¬ 
sao com mudanga; e (3) modelos de desequilibrio. 

Nos modelos de regressao considerados neste texto, supoe-se que os parametros, os fi, sejam 
desconhecidos mas fixos. Os modelos de coeficientes aleatorios — e ha varias versoes deles — su- 
poem que os f J > tambem sejam aleatorios. Um importante trabalho de referenda nessa area e o de 
Swamy. 21 


20 O procedimento do teste de Chow pode ser realizado mesmo na presenga de heterocedasticidade, mas depois se 
tera de usar o teste de Wald. Os calculos matematicos envoividos no teste sao complexos. No capftulo sobre 
heterocedasticidade, retomaremos o assunto. 

21 SWAMY, P.A.V. B. Statistical inference in random coefficient regression models. Berlim: Springer-Verlag, 1971. 
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No modelo com variaveis binarias usando tanto interceptos quanto coeficientes angulares diferen- 
ciais, pressupoe-se implicitamente que saibamos qual e o ponto de quebra. Assim, no exemplo da 
poupanga-renda para 1970-1995, dividimos o perfodo em 1970-1981 e 1982-1995, os perfodos pre e 
pos-recessao, acreditando que a recessao em 1982 mudou a relagao entre poupanga e renda. As vezes 
nao e facil identificar quando ocorre a quebra. A tecnica dos modelos de regressao com mudanga 
(SRM, do ingles switching regression models ) foi desenvolvida para tais situagoes. O SRM trata o 
ponto de quebra como uma variavel aleatoria e, por meio de um processo iterativo, determina quando 
a quebra pode ter acontecido realmente. O trabalho seminal nessa area e o de Goldfeld e Quandt . 22 

Tecnicas especiais de estimagao sao exigidas para lidar com o que e conhecido como situa- 
g5es de desequilibrio, situagoes em que mercados nao se ajustam (a demanda nao e igual a ofer- 
ta). O exemplo classico e aquele da demanda e da oferta de um bem. A demanda de um bem e a 
fungao de seu prego e outras variaveis, e a oferta dele e a fungao de seu prego e outras variaveis, 
algumas das quais sao diferentes daquelas que entram na fungao de demanda. A quantidade de 
bens comprados e vendidos de fato pode nao ser necessariamente igual a obtida igualando-se a 
demanda a oferta, levando, assim, ao desequilibrio. Para uma discussao completa de modelos de 
desequilibrio, o leitor pode consultar Quandt . 23 


9.12 Um exemplo para concluir 

Terminamos este capftulo com um exemplo que ilustra alguns pontos apresentados. ATabela 9.7 
fornece dados em uma amostra de 261 trabalhadores em uma cidade industrial no sul da India, em 
1990. 

As variaveis sao definidas como se segue: 

RS = renda semanal em rupias 
Idade = idade em anos 
Z) gen = 0 para homem e 1 para mulher 

DE 2 — uma variavel binaria assumindo o valor de 1 para trabalhadores com primeiro grau 
completo 

DE 2 = uma variavel binaria tomando o valor de 1 para trabalhadores com segundo grau 
completo 

DE 4 — uma variavel binaria assumindo o valor de 1 para trabalhadores com escolaridade 
superior ao segundo grau 

DPT — uma variavel binaria assumindo o valor de 1 para trabalhadores contratados com 
tempo indeterminado e o valor de 0 para trabalhadores temporaries 

A categoria de referenda sao trabalhadores do genero masculino com primeiro grau incompleto e 
trabalho temporario. Outro interesse e descobrir como os salarios semanais estao relacionados a ida¬ 
de, genero, nivel de escolaridade e tempo no emprego. Com essa finalidade, estimamos o seguinte 
modelo de regressao: 

In RS, — /3\ + /QIdade, + D^ cn + ^4 DE 2 + (TDE 2 4- fi^DE^ + [3-jDPT + u, 

Seguindo a literatura de Economia do Trabalho, estamos expressando o logaritmo (natural) de salarios 
como uma fungao das variaveis explanatorias. Como observamos no Capftulo 6 , a distribuigao de 


22 GOLDFELD, S.; QUANDT, R. Nonlinear methods in econometrics. Amsterda: North Holland, 1972. 

23 QUANDT, Richard E. The econometrics of disequilibrium. Nova York: Basil Blackwell, 1988. 
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TABELA 9.7 Salarios de trabalhadores em rupias indianas, 1990 


RS 

Idade 

de 2 

DE, 

de 4 

DPT 

Dgen 

RS 

Idade 

de 2 

DE, 

de 4 

DPT 

Dgen 

120 

57 

0 

0 

0 

0 

0 

120 

21 

0 

0 

0 

0 

0 

224 

48 

0 

0 

1 

1 

0 

25 

18 

0 

0 

0 

0 

1 

132 

38 

0 

0 

0 

0 

0 

25 

11 

0 

0 

0 

0 

1 

75 

27 

0 

1 

0 

0 

0 

30 

38 

0 

0 

0 

1 

1 

111 

23 

0 

1 

0 

0 

1 

30 

17 

0 

0 

0 

1 

1 

127 

22 

0 

1 

0 

0 

0 

122 

20 

0 

0 

0 

0 

0 

30 

18 

0 

0 

0 

0 

0 

288 

50 

0 

1 

0 

1 

0 

24 

12 

0 

0 

0 

0 

0 

75 

45 

0 

0 

0 

0 

1 

119 

38 

0 

0 

0 

1 

0 

79 

60 

0 

0 

0 

0 

0 

75 

55 

0 

0 

0 

0 

0 

85,3 

26 

1 

0 

0 

0 

1 

324 

26 

0 

1 

0 

0 

0 

350 

42 

0 

1 

0 

1 

0 

42 

18 

0 

0 

0 

0 

0 

54 

62 

0 

0 

0 

1 

0 

100 

32 

0 

0 

0 

0 

0 

110 

23 

0 

0 

0 

0 

0 

136 

41 

0 

0 

0 

0 

0 

342 

56 

0 

0 

0 

1 

0 

107 

48 

0 

0 

0 

0 

0 

77,5 

19 

0 

0 

0 

1 

0 

50 

16 

1 

0 

0 

0 

1 

370 

46 

0 

0 

0 

0 

0 

90 

45 

0 

0 

0 

0 

0 

156 

26 

0 

0 

0 

1 

0 

377 

46 

0 

0 

0 

1 

0 

261 

23 

0 

0 

0 

0 

0 

150 

30 

0 

1 

0 

0 

0 

54 

16 

0 

1 

0 

0 

0 

162 

40 

0 

0 

0 

0 

0 

130 

33 

0 

0 

0 

0 

0 

18 

19 

1 

0 

0 

0 

0 

112 

27 

1 

0 

0 

0 

0 

128 

25 

1 

0 

0 

0 

0 

82 

22 

1 

0 

0 

0 

0 

47,5 

46 

0 

0 

0 

0 

1 

385 

30 

0 

1 

0 

1 

0 

135 

25 

0 

1 

0 

0 

0 

94,3 

22 

0 

0 

1 

1 

1 

400 

57 

0 

0 

0 

1 

0 

350 

57 

0 

0 

0 

1 

0 

91,8 

35 

0 

0 

1 

1 

0 

108 

26 

0 

0 

0 

0 

0 

140 

44 

0 

0 

0 

1 

0 

20 

14 

0 

0 

0 

0 

0 

49,2 

22 

0 

0 

0 

0 

0 

53,8 

14 

0 

0 

0 

0 

1 

30 

19 

1 

0 

0 

0 

0 

427 

55 

0 

0 

0 

1 

0 

40,5 

37 

0 

0 

0 

0 

1 

18 

12 

0 

0 

0 

0 

0 

81 

20 

0 

0 

0 

0 

0 

120 

38 

0 

0 

0 

0 

0 

105 

40 

0 

0 

0 

0 

0 

40,5 

17 

0 

0 

0 

0 

0 

200 

30 

0 

0 

0 

0 

0 

375 

42 

1 

0 

0 

1 

0 

140 

30 

0 

0 

0 

1 

0 

120 

34 

0 

0 

0 

0 

0 

80 

26 

0 

0 

0 

0 

0 

175 

33 

1 

0 

0 

1 

0 

47 

41 

0 

0 

0 

0 

1 

50 

26 

0 

0 

0 

0 

1 

125 

22 

0 

0 

0 

0 

0 

100 

33 

1 

0 

0 

1 

0 

500 

21 

0 

0 

0 

0 

0 

25 

22 

0 

0 

0 

1 

1 

100 

19 

0 

0 

0 

0 

0 

40 

15 

0 

0 

0 

1 

0 

105 

35 

0 

0 

0 

0 

0 

65 

14 

0 

0 

0 

1 

0 

300 

35 

0 

1 

0 

1 

0 

47,5 

25 

0 

0 

0 

1 

1 

115 

33 

0 

1 

0 

1 

1 

163 

25 

0 

0 

0 

1 

0 

103 

27 

0 

0 

1 

1 

1 

175 

50 

0 

0 

0 

1 

1 

190 

62 

1 

0 

0 

0 

0 

150 

24 

0 

0 

0 

1 

1 

62,5 

18 

0 

1 

0 

0 

0 

163 

28 

0 

0 

0 

1 

0 

50 

25 

1 

0 

0 

0 

0 

163 

30 

1 

0 

0 

1 

0 

273 

43 

0 

0 

1 

1 

1 

50 

25 

0 

0 

0 

1 

1 

175 

40 

0 

1 

0 

1 

0 

395 

45 

0 

1 

0 

1 

0 

117 

26 

1 

0 

0 

1 

0 

175 

40 

0 

0 

0 

1 

1 

950 

47 

0 

0 

1 

0 

0 

87,5 

25 

1 

0 

0 

0 

0 

100 

30 

0 

0 

0 

0 

0 

75 

18 

0 

0 

0 

0 

0 

140 

30 

0 

0 

0 

0 

0 

163 

24 

0 

0 

0 

1 

0 

97 

25 

0 

1 

0 

0 

0 

325 

55 

0 

0 

0 

1 

0 

150 

36 

0 

0 

0 

0 

0 

121 

27 

0 

1 

0 

0 

0 

25 

28 

0 

0 

0 

0 

1 

600 

35 

1 

0 

0 

0 

0 

15 

13 

0 

0 

0 

0 

1 

52 

19 

0 

0 

0 

0 

0 

131 

55 

0 

0 

0 

0 

0 

117 

28 

1 

0 

0 

0 

0 
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variaveis como salarios tende a ser assimetrica; transforma 5 oes logaritmicas de tais variaveis reduzem 
tanto a assimetria quanto a heterocedasticidade. 

Usando o EViews6, obtemos os seguintes resultados de regressao. 

Dependent Variable: Ln(RS) 

Method: Least Squares 
S amp1e: 1 2 61 

Included observations: 261 



Coefficient 

Std. Error 

t-Statistic 

Prob. 

c 

3.706872 

0.113845 

32.56055 

0.0000 

AGE 

0.026549 

0.003117 

8.516848 

0.0000 

■^gen 

-0.656338 

0.088796 

-7.391529 

0.0000 

de 2 

0.113862 

0.098542 

1.155473 

0.2490 

de 3 

0.412589 

0.096383 

4.280732 

0.0000 

de 4 

0.554129 

0.155224 

3.569862 

0.0004 

DPT 

0.558348 

0.079990 

6.980248 

0.0000 

R-squared 

0.534969 

Mean 

dependent var. 

4.793390 

Adjusted R-squared 

0.523984 

S.D. 

dependent var. 

0.834277 

S .E . 

of regression 

0.575600 

Akaike info criterion 

1.759648 

Sum 

squared resid. 

84.15421 

Schwarz criterion 

1.855248 

Log 

likelihood 

-222.6340 

Hannan-Quinn criter. 

1.798076 

F-statistic 

48.70008 

Durbin-Watson stat. 

1.853361 

Prob(F-statistic) 

0.000000 





Esses resultados mostram que o logaritmo de salarios esta positivamente relacionado a idade, 
educagao e permanencia no emprego, mas negativamente relacionado ao genero, um achado nao 
surpreendente. Embora parega nao haver diferenga pratica nos salarios semanais de trabalhadores 
com graus de escolaridade primario ou menor, os salarios semanais sao mais altos para trabalhado¬ 
res com segundo grau e muito mais altos para trabalhadores com educagao superior. 

Os coeficientes das variaveis binarias devem ser interpretados como valores diferenciais da cate- 
goria de referencia. O coeficiente da variavel DPT sugere que aqueles trabalhadores com contratos 
por tempo indeterminado ganham, em media, mais dinheiro que aqueles cujos trabalhos sao tempo¬ 
raries. 

Como sabemos do Capftulo 6, em um modelo log-linear (variaveis dependentes em forma de lo¬ 
garitmo e variaveis explanatorias em forma linear), o coeficiente angular de uma variavel explanato¬ 
ry representa semielasticidade, ele fornece a vari agao percentual ou relativa na variavel dependente 
para uma variagao de unidade no valor da variavel explanatory. Mas, como foi observado no texto, 
quando a variavel explanatory e uma variavel dummy, temos de ser cuidadosos. Aqui temos de tomar 
o antilogaritmo do coeficiente binario estimado, subtrair 1 dele e multiplicar o resultado por 100. Para 
descobrirmos a variagao percentual em salarios semanais para aqueles trabalhadores que tem empre- 
gos por tempo indeterminado versus aqueles que tem empregos temporaries, tomamos o antilogaritmo 
do coeficiente DPT de 0,558348, subtrafmos 1 e entao multiplicamos a diferenga por 100. Para nosso 
exemplo, isso resulta ( e 0 ’ 558348 -1) = (1,74778 -1) = 0,74778 ou cerca de 75%. O leitor e aconselha- 
do a calcular tais variagoes percentuais para as outras variaveis binarias inclufdas no modelo. 

Nossos resultados mostram que o genero e a escolaridade tem efeitos diferenciais nos ganhos 
semanais. E possivel que haja uma interagao entre genero e o nivel educacional? Os trabalhadores do 
genero masculino com graus de escolaridades mais altos ganham salarios mais altos que as mulheres 
com graus de escolaridade mais altos? Para examinarmos essa possibilidade, podemos estender a 
regressao anterior de salarios pela interagao do genero com educagao. Os resultados da regressao sao 
os seguintes: 
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Dependent Variable: Ln(RS) 
Method: Least Squares 
S amp1e: 1 2 61 

Included observations: 261 



Coefficient Std. Error 

t-Statistic 

Prob. 

c 

3.717540 

0.114536 

32.45734 

0.0000 

AGE 

0.027051 

0.003133 

8.634553 

0.0000 

Agen 

-0.758975 

0.110410 

-6.874148 

0.0000 

de 2 

0.088923 

0.106827 

0.832402 

0.4060 

de 3 

0.350574 

0.104309 

3.360913 

0.0009 

DEn 

0.438673 

0.186996 

2.345898 

0.0198 

Dqen* DE2 

0.114908 

0.275039 

0.417788 

0.6765 

Dqen* DE3 

0.391052 

0.259261 

1.508337 

0.1327 

AgerA-^-Al 

0.369520 

0.313503 

1.178681 

0.2396 

DPT 

0.551658 

0.080076 

6.889198 

0.0000 

R-squared 


0.540810 Mean 

dependent var. 

4.793390 

Adjusted R- 

squared 

0.524345 S.D. 

dependent var. 

0.834277 

S.E. of regression 

0.575382 Akaike info criterion 

1.769997 

Sum squared 

resid. 

83.09731 Schwarz criterion 

1.906569 

Log likelihood -220.9847 Hannan-Quinn criter. 

1.824895 

F-statistic 


32.84603 Durbin-Watson stat. 

1.856488 

Prob (F-statistic) 

0.000000 




Embora as variaveis binarias de intera§ao mostrem que haja algumas intera 5 oes entre genero e o 
grau de escolaridade, o efeito nao e estatisticamente significative), pois nenhum dos coeficientes de 
intera?ao sao estatisticamente significativos, considerados individualmente. 

E interessante notar que, se excluirmos as variaveis binarias de educa 5 ao, mas mantivermos as 
variaveis binarias de intera 5 ao, obteremos os seguintes resultados: 


Dependent Variable: Ln(RS) 
Method: Least Squares 
S amp1e: 1 2 61 

Included observations: 261 



Coefficient Std. Error 

t-Statistic 

Prob. 

C 

3.836483 

0.106785 

35.92725 

0.0000 

AGE 

0.025990 

0.003170 

8.197991 

0.0000 

Ajen 

-0.868617 

0.106429 

-8.161508 

0.0000 

Dq en * DE 2 

0.200823 

0.259511 

0.773851 

0.4397 

Dqen* DE 2 

0.716722 

0.245021 

2.925140 

0.0038 

Ajen*£^4 

0.752652 

0.265975 

2.829789 

0.0050 

DPT 

0.627272 

0.078869 

7.953332 

0.0000 

R-squared 


0.514449 Mean 

dependent var. 

4.793390 

Adjusted R- 

squared 

0.502979 S.D. 

dependent var. 

0.834277 

S.E. of regression 

0.588163 Akaike info criterion 

1.802828 

Sum squared 

resid. 

87.86766 Schwarz criterion 

1.898429 

Log likelihood -228.2691 Hannan-Quinn criter. 

1.841257 

F-statistic 


44.85284 Durbin-Watson stat. 

1.873421 

Prob (F-statistic) 

0.000000 
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Resumo e 
conclusoes 


EXERCICIOS 


Agora parece que as variaveis binarias para escolaridade nao tem efeito nos salarios semanais, 
mas introduzidas em um formato interativo parecem ter. Como mostra o exercfcio, deve-se ter caute- 
la no uso de variaveis binarias. E deixado como exercicio para o leitor descobrir se as variaveis bina¬ 
rias para escolaridade interagem com a DPT. 


1. As variaveis binarias, tomando valores de 1 e zero (ou suas transformagoes lineares), sao um 
meio de introduzir regressores qualitativos em modelos de regressao. 

2. As variaveis binarias sao um instrumento de classificagao de dados por dividirem uma amos- 
tra em varios subgrupos com base nas qualidades ou atributos (genero, estado civil, raga, 
religiao etc.) e implicitamente permitem que se calculem regressoes para cada subgrupo. Se 
ha diferengas na resposta do regressando a variagao nas variaveis qualitativas nos varios 
subgrupos, elas se refletirao nas diferengas nos interceptos ou coeficientes angulares, ou 
ambos, dos varios subgrupos de regressoes. 

3. Embora seja uma ferramenta versatil, a tecnica das variaveis binarias precisa ser aplicada 
com cuidado. Primeiro, se a regressao content um termo constante, o numero de variaveis 
binarias deve ser menor que o numero de classificagoes de cada variavel qualitativa. Em 
segundo lugar, o coeficiente ligado as variaveis binarias deve ser interpretado sempre em 
relagao ao grupo-base, ou referenda —o grupo que recebe o valor de zero. Abase escolhida 
dependera do proposito de pesquisa. Por fun. se um modelo tem varias variaveis qualitativas 
com varias classes, a introdugao de variaveis binarias pode consumir um grande numero de 
graus de liberdade. Deve-se sempre ponderar o numero de variaveis binarias a serem introdu¬ 
zidas em fungao do numero total de observagoes dispom'veis para analise. 

4. Entre suas varias aplicagoes, este capftulo considerou algumas. Estas inclufram (1) comparar 
duas (ou mais) regressoes, (2) dessazonalizar dados de serie temporal, (3) variaveis interati- 
vas, (4) interpretagao de variaveis binarias em modelos semilogantmicos e (5) modelos de 
regressao linear segmentada. 

5. Tambem fizemos advertencias quanto ao uso de variaveis binarias em situagoes de heterocedas- 
ticidade e autocorrelagao. Mas, uma vez que trataremos desses assuntos detalhadamente nos ca- 
pftulos subsequentes, retomaremos esses topicos. 


9.1. Tendo-se dados mensais ao longo de varios anos, quantas variaveis binarias podem ser intro¬ 
duzidas para testar as seguintes hipoteses: 

a. Todos os 12 meses do ano mostram padroes sazonais. 

b. Apenas fevereiro, abril, junho, agosto, outubro e dezembro mostram padroes sazonais. 

9.2. Considere os resultados (as razoes t estao entre parenteses) da regressao a seguir:* 


Y, = 1286 + 104,97^-- 

t = (4,67) (3,70) 

- 19,47X 6 , + 266,06A7, 
(-0,40) (6,94) 


0 , 026 X 3 , + 1,20X4,+ 0,69X 5 , 

(-3,80) (0,24) (0,08) 

- 118,64X8, _ 110,61X9, 
(-3,04) (-6,14) 

R 2 = 0,383 n = 1543 


em que Y — horas de trabalho por ano desejadas pela esposa, calculadas como horas de trabalho 
por ano, mais semanas em que se procurava emprego 


* LEUTHOLD, Jane. "The effect of taxation on the hours worked by married women." Industrial and Labor Rela¬ 
tions Review, jul. 1978. n. 4, p. 520-526. (Notagao mudada para ajustar-se ao nosso formato.) 
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X 2 — ganhos reais medios por hora da esposa, descontados os impostos 
X 2 = ganhos reais do marido no ano anterior, descontados os impostos 
X 4 — idade da esposa em anos 
X 5 = anos de escolaridade completados pela esposa 

X 6 = variavel atitude: 1 = se a informante acha que nao ha problema em trabalhar, desde 
que ela e o marido concordem, 0 = caso contrario 
X 7 = variavel atitude: 1 = se o marido da informante esta de acordo com o trabalho da es¬ 
posa, 0 = caso contrario 

X s — numero de filhos com menos de 6 anos de idade 
X 9 — numero de filhos com idades entre 6 e 13 anos 

a. Os sinais dos coeficientes de varios regressores nao binarios fazem sentido do ponto de 
vista economico? Justifique sua resposta. 

b. Como poderiamos interpretar as variaveis binarias X 6 e X 7 ? Essas variaveis sao estatistica- 
mente significativas? Como a amostra e bastante grande, e possivel recorrer a regra pratica 
“2-f” para responder a esta pergunta. 

c. Por que se pode considerar que as variaveis de idade e escolaridade nao sejam fatores signi- 
ficativos neste estudo, na decisao de uma mulher em trabalhar? 


TAB ELA 9.8 


Taxa 

Vagas 




Taxa 

Vagas 



Matriz dos dados para 

Ano 

de 

em 



Ano 

de 

em 



regressao, no 

e 

desemprego. 

aberto. 



e 

desemprego, 

aberto, 



Exercfcio 9.3 

trimestre 

TD, % 

% 

D 

DV 

trimestre 

TD, % 

% 

D 

DV 

Fonte: GUJARATI, 

1 958-IV 

1,915 

0,510 

0 

0 

1965-1 

1,201 

0,997 

0 

0 

Damodar. “The behavior of 
unemployment and unfilled 

1 959-1 

1,876 

0,541 

0 

0 

-II 

1,192 

1,035 

0 

0 

vacancies: Great Britain, 

—II 

1,842 

0,541 

0 

0 

-III 

1,259 

1,040 

0 

0 

1958-1971.” The Economic 

-III 

1,750 

0,690 

0 

0 

-IV 

1,192 

1,086 

0 

0 

Journal, v. 82, p. 202, mar. 
1972. 

-IV 

1,648 

0,771 

0 

0 

1966-1 

1,089 

1,101 

0 

0 

1 960-1 

1,450 

0,836 

0 

0 

-II 

1,101 

1,058 

0 

0 


—II 

1,393 

0,908 

0 

0 

-III 

1,243 

0,987 

0 

0 


-III 

1,322 

0,968 

0 

0 

-IV 

1,623 

0,819 

1 

0,819 


-IV 

1,260 

0,998 

0 

0 

1967-1 

1,821 

0,740 

1 

0,740 


1961-1 

1,171 

0,968 

0 

0 

-II 

1,990 

0,661 

1 

0,661 


—II 

1,182 

0,964 

0 

0 

-III 

2,114 

0,660 

1 

0,660 


-III 

1,221 

0,952 

0 

0 

-IV 

2,115 

0,698 

1 

0,698 


-IV 

1,340 

0,849 

0 

0 

1968-1 

2,150 

0,695 

1 

0,695 


1962-1 

1,411 

0,748 

0 

0 

-II 

2,141 

0,732 

1 

0,732 


-II 

1,600 

0,658 

0 

0 

-III 

2,167 

0,749 

1 

0,749 


-III 

1,780 

0,562 

0 

0 

-IV 

2,107 

0,800 

1 

0,800 


-IV 

1,941 

0,510 

0 

0 

1969-1 

2,104 

0,783 

1 

0,783 


1963-1 

2,178 

0,510 

0 

0 

-II 

2,056 

0,800 

1 

0,800 


—II 

2,067 

0,544 

0 

0 

-III 

2,170 

0,794 

1 

0,794 


-III 

1,942 

0,568 

0 

0 

-IV 

2,161 

0,790 

1 

0,790 


-IV 

1,764 

0,677 

0 

0 

1970-1 

2,225 

0,757 

1 

0,757 


1964-1 

1,532 

0,794 

0 

0 

-II 

2,241 

0,746 

1 

0,746 


—II 

1,455 

0,838 

0 

0 

-III 

2,366 

0,739 

1 

0,739 


-III 

1,409 

0,885 

0 

0 

-IV 

2,324 

0,707 

1 

0,707 


-IV 

1,296 

0,978 

0 

0 

1971-1 

2,516* 

0,583* 

1 

0,583 







-II 

2,909* 

0,524* 

1 

0,524 


Estimativas preliminares. 
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9.3. Considere os seguintes resultados de regressao.* (Os dados estao na Tabela 9.8.) 

UN, = 2,7491 + 1J507A- 1.5294F, - 0,8511(AL,) 

t = (26,896) (3,6288) (- 12,5552) (- 1,9819) 

R 2 = 0,9128 

em que TD = taxa de desemprego, % 

V — vagas em aberto, % 

D — 1 para o perfodo iniciado no quarto trimestre de 1966 
= 0 para o perfodo anterior ao quarto trimestre de 1966 
t — tempo, medido em trimestres 

Nota: no quarto trimestre de 1966, o (entao) governo trabalhista liberalizou a Lei de Segurida- 
de, substituindo o sistema de seguro-desemprego baseado em um percentual fixo por um siste- 
ma que combinava o percentual fixo aos beneficios relacionados aos ganhos (recebidos pelo 
funcionario), o que aumentou o nfvel de beneficios aos desempregados. 

a. Quais suas expectativas sobre a relac^ao entre desemprego e vagas em aberto? 

b. Mantendo a taxa de vagas em aberto constante, qual a taxa media de desemprego no perfo¬ 
do que se inicia no quarto trimestre de 1966? Ela e estatisticamente diferente do perfodo 
anterior ao quarto trimestre de 1966? Como voce sabe? 

c. Os coeficientes angulares nos dois periodos anteriores diferem estatisticamente? Como 
verificamos isso? 

d. Podemos concluir deste estudo que os generosos beneficios de desemprego levam a taxas 
mais altas de desemprego? Isso faz sentido em termos economicos? 

9.4. Dos dados anuais para 1972-1979, William Nordhaus estimou o modelo a seguir para explicar 
o comportamento dos prefos do petroleo detenninados pela Opep (os erros padrao estao entre 
parenteses). 

y,- 0,3x u + 5,22x2, 
ep = (0,03) (0,50) 

em que y — diferen?a entre os precjos atuais e os do ano anterior ($ por barril) 

Xi = difcrenca entre o pre£o spot do ano corrente e o pre?o da Opep no ano anterior 
X 2 = 1 para 1974 e 0 para os demais anos 

Interprete esse resultado e mostre os resultados graficamente. O que esses resultados sugerem 
sobre o poder de monopolio da Opep? 

9.5. Considere o seguinte modelo: 

}) = Ot\ + C^A 3" fiXi + Uj 

em que Y = salario anual de um professor universitario 
X = anos de experiencia de ensino 
D — variavel dummy para genero 

Considere tres maneiras de definir a variavel dummy: 

a. D — 1 para homens, 0 para mulheres 

b. D — 1 para mulheres, 2 para homens. 

c. D — 1 para mulheres, — 1 para homens. 

* GUJARATI, Damodar. "The behaviour of unemployment and unfilled vacancies: reat Britain, 1958-1971." The 
Economic journal, mar. 1972. v. 82, p. 195-202. 

t "Oil and economic performance in industrial countries." Brookings Papers on Economic Activity, 1980. p. 
341-388. 
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Interprete o modelo de regressao anterior para cada definifao de variavel dummy. Um metodo 
e preferivel a outro? Justifique sua resposta. 

9.6. Retome a regressao (9.7.3). Como seria possivel testar a hipotese de que os coeficientes de D 2 
e £) 3 sao iguais? E que os coeficientes de D 2 e Z ) 4 sao iguais? Se o coeficiente de D 3 for estatis- 
ticamente diferente daquele de D 2 e o coeficiente de Z ) 4 for diferente de D 2 , isso significa que 
os coeficientes de D 3 e Z ) 4 tambem sao diferentes? 

Dica\ var (A ± B) — VAR (A) + var ( B) ± 2 cov (A, B) 

9.7. Volte ao exemplo de poupan 9 a-renda nos Estados Unidos, discutido na Seqiao 9.5. 

a. Como se obteriam os erros padrao dos coeficientes de regressao dados nas Equa?oes (9.5.5) 
e (9.5.6), obtidos da regressao combinada (9.5.4)? 

b. Para respostas numericas, que informa 9 oes adicionais, se houver, sao necessarias? 

9.8. Em seu estudo sobre horas de trabalho gastas pela FDIC (Federal Deposit Insurance Corporation ) 
em 91 auditorias bancarias, R. J. Miller estimou as seguintes fu nodes: 

InT = 2,41 + 0,3674 lnJ^ + 0,2217 lnX 2 + 0,0803 In X 3 
(0,0477) (0,0628) (0,0287) 

-0,1755£>i + 0,2799£) 2 + 0,5634£» 3 - 0,2572£) 4 

(0,2905) (0,1044) (0,1657) (0,0787) 

R 2 = 0,766 


em que Y = horas trabalhadas pelos auditores da FDIC 
X\ = ativos totais do banco 
X 2 — numero total de agendas do banco 

X 2 = razao de emprestimos duvidosos em rela 9 ao ao total dos emprestimos concedidos pelo 
banco 

D\ — 1 se a administra 9 ao do banco foi classificada como “otima” 

D 2 — 1 se a administra 9 ao do banco foi classificada como “boa” 

D 3 = 1 se a administra 9 ao do banco foi classificada como “satisfatoria” 

D 4 — 1 se o exame foi conduzido em conjunto com orgao estadual 
Os dados entre parenteses sao os erros padrao estimados. 

a. Interprete esses resultados. 

b. Ha algum problema em interpretar as variaveis binarias neste modelo uma vez que Y esta em 
forma logaritmica? 

c. Como voce interpretaria os coeficientes binarios? 

9.9. Para avaliar o efeito da polftica do Fed de desregulamentar as taxas de juros a come 9 ar em 
julho de 1979, Sidney Langer, um aluno meu, estimou o seguinte modelo para o periodo que 
vai do terceiro trimestre de 1975 ao segundo trimestre de 1983.^ 

Y,= 8,5871 - 0,1328 P, - 0,7102Un r - 0,2389 M, 
ep= (1,9563) (0,0992) (0,1909) (0,0727) 

+ 0,659217 -1 + 2,583 IDum, R 2 = 0,9156 
(0,1036) (0,7549) 


* "Examination of man hour cost for independent, join and divided examination programs." Journal of Bank 
Research, 1980. v. 11, p. 28-35. Nota: as notagoes foram aiteradas para se ajustarem aos padroes deste livro. 
t LANGER, Sidney. "Interest rate deregulation and short-term interest rates." Nao publicado. 
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FIGURA 9.7 

Regressao linear 

segmentada 

descontmua. 


em que Y — taxa de juros das Letras do Tesouro dos Estados Unidos de 3 meses 
P — taxa de inflac^ao esperada 
TD — taxa de desemprego ajustada sazonalmente 
M — varia§oes da base monetaria 

Dum = variavel binaria, levando em conta o valor de 1 para observa§oes a come 9 ar em 
1° de julho de 1979 

a. Interprete esses resultados. 

b. Qual foi o efeito da dcsregulamcntagao da taxa de juros? Os resultados fazem sentido do 
ponto de vista economico? 

c. Os coeficientes de P„ TD,e M, sao negativos. Qual seria a logica economica disso? 

9.10. Retome a regressao segmentada discutida no texto. Suponha que nao haja apenas uma mudan- 

9 a no coeficiente angular de X*, mas que a linha de regressao tambem de um salto, como 
mostra a Figura 9.7. Como voce modificaria a Equa 9 §o (9.8.1) para levar em conta o salto na 
linha de regressao em X *? 


Y 



9.11. Determinantes de preco por onca de refrigerante. Cathy Schaefer, uma de minhas alunas, es- 
timou a seguinte regressao usando 77 observa^'oes: 

Pi - Po + Pi Du + P2D21 + PiDu + Hi 


em que P, — pre 90 por on 9 a de refrigerante 

D u = 001 se comprado em loja de descontos 
= 010 se comprado em loja de rede 
= 100 se comprado em loja de conveniencia 
I) 2 i — 10 se for de marca 
= 01 se nao for de marca 
D 3; = 0001 se tiver 67,6 on 9 as (dois litros) 

= 0010 se tiver 28-33 oncas (um litro) 

= 0100 se tiver 16 on 9 as (meio litro) 

= 1000 se tiver 12 on 9 as (330 ml) 

Os resultados foram os seguintes: 

Pi = 0,0143 - 0,0000040,, + 0,0090D 2l + 0,00001E» 3! 

ep= ( 0 , 00001 ) ( 0 , 00011 ) ( 0 , 00000 ) 

t = (-0,3837) (8,3927) (5,8125) 

R 2 = 0,6033 


SCHAEFER, Cathy. "Price per ounce of cola beverage as a function of place of purchase, size of container, and 
branded or unbranded product." Trabalho semestral nao pubiicado. 
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Nota: os erros padrao sao mostrados apenas ate cinco casas decimals. 

a. Comente a respeito da forma como as variaveis binarias foram incluidas no modelo. 

b. Supondo que a forma de inclusao das variaveis binarias seja aceitavel, como poderfamos 
interpretar os resultados? 

c. O coeficiente de D 3 e positivo e estatisticamente significativo. Como voce racionalizaria 
este resultado? 

9.12. Com base nos dados para 101 palses sobre a renda per capita em dolares (X) e da expectativa 
de vida em anos ( Y) no inlcio da decada de 1970, Sen e Srivastava obtiveram os seguintes re¬ 
sultados de regressao:* 

%=- 2,40 + 9,39 In X t - 3,36 [D.ilnX, - 7)] 

ep= (4,73) (0,859) (2,42) R 2 = 0,752 

em que D, = 1 se In Xj > 7 e D , = 0 nos demais casos. Nota: quando In X , = 7, X — $1,097 
aproximadamente. 

a. Quais poderiam ser as razoes para introduzir a forma logaritmica da variavel renda? 

b. Como poderiamos interpretar o coeficiente 9,39 de In Xf! 

c. Qual seria a razao da inclusao do regressor D, (In X) - 7)? Como podemos explicar verbal- 
mente esse regressor? E como podemos interpretar o coeficiente -3,36 desse regressor 
(Dica: regressao linear segmentada)? 

d. Supondo uma renda per capita de $ 1,097 como sendo a linha divisoria entre os paises mais 
pobres e mais ricos, de que maneira derivariamos a regressao para palses cuja renda per capita 
seja inferior a $ 1,097 e a regressao para paises cuja renda per capita seja maior que $ 1,097? 

e. Que conclusoes gerais voce tira do resultado de regressao apresentado neste problema? 

9.13. Considere o seguinte modelo: 

Yi = P i + PiDi + Uj 

em que D , = 0 para as 20 primeiras observances e D,— 1 para as 30 observances remanescen- 
tes. Sabe-se que var ( uf ) = 300. 

a. Como interpretamos /l, e /b? 

b. Quais os valores medios dos dois grupos? 

c. Como calcularlamos a variancia de + fijf! Nota : a cov (/3i, Pt) — —15. 

9.14. Para avaliar o efeito das leis estaduais do direito ao trabalho (que nao exigem a filiafao a um 
sindicato como pre-condinao de emprego) sobre filiapao a sindicatos, sao obtidos os seguintes 
resultados de regressao, dos dados para 50 Estados nos Estados Unidos, para 1982: 1 

PES, = 19,8066 - 9,3917 DAT, 

t= (17,0352) (-5,1086) 

r 2 = 0,3522 

em que PES = percentual de funcionarios de empresas privadas sindicalizados, em 1982; e DAT = 1 
se existe legislanao de direito ao trabalho, 0 se nao existe. Nota: Em 1982, 20 Estados tinham 
leis de direito ao trabalho. 

a. A priori, qual a relapao esperada entre PES e DAT? 

b. Os resultados da regressao apoiam as expectativas anteriores? 

c. Interprete os resultados de regressao. 

* SEN, Ashish; SRIVASTAVA, Muni. Regression analysis: theory, methods and applications. Nova York: Springer- 
-Verlag, 1990. p. 92. Notapao alterada. 

t Os dados usados nos resultados de regressao foram obtidos de MELTZ, N. M. "Interstate and interprovincial 
differences in union density." Industrial Relations, 1989. v. 28, n. p. 142-158. 
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d. Qual foi o percentual medio dos empregados sindicalizados do setor privado nos Estados 
que nao tinham leis de direito ao trabalho? 

9.15. No modelo de regressao a seguir: 

Yi = fi\ + PiDi + Uj 

Y representa o salario por hora em $ e D a variavel dummy, tomando o valor de 1 para um 
aluno com curso universitario e o valor de 0 para um aluno de segundo grau. Usando as formu¬ 
las de MQO dadas no Capitulo 3, mostre quc fi] = % g e $ 2 = Y cs - E sg , em que os subscritos 
tem os significados: sg = segundo grau e cs = curso superior. No total, ha n , pessoas com se¬ 
gundo grau e n 2 pessoas com segundo grau completo, para uma amostra de n — n x + n 2 . 

9.16. Para estudar a taxa de crescimento da populanao em Belize no periodo de 1970-1992, Mukherjee 
et al. estimaram os seguintes modelos: ‘ 


Modelo I: In (Pop), = 

4,73 + 

0,024f 


t = 

(781,25) 

(54,71) 


Modelo II: In (Pop), = 

4,77 + 

0,015? - 0,075 D, + 

0,011 (A0 

t = 

(2477,92) 

(34,01) (- 17,03) 

(25,54) 


em que Pop = populagao em milhoes; t — variavel de tendencia; D, — I para observances 
iniciadas em 1978 e 0 antes de 1978; e In = logaritmo natural. 

a. No Modelo I, qual a taxa de crescimento da populapao de Belize no periodo de amostra? 

b. As taxas de crescimento da populanao sao estatisticamente diferentes dos periodos anteriores e 
posteriores a 1978? Como podemos saber? Se forem diferentes, quais as taxas de crescimento 
para 1972-1977 e para 1978-1992? 

Exercfcios aplicados 

9.17. Usando os dados da Tabela 9.8., teste a hipotese de que as variancias dos erros no 4° trimestre de 
1958 ao 3° trimestre de 1966 e do 4° trimestre de 1966 ao 2° trimestre de 1971 sao as mesmas. 

9.18. Usando a metodologia discutida no Capitulo 8 , compare as regressoes sem restr^ao (9.7.3) e 
restrita (9.7.4); isto e, teste a validade das restri^oes impostas. 

9.19. Na regressao poupan^'a-rcnda para os Estados Unidos (9.5.4) discutida neste capitulo, suponha 
que, em vez de usar valores 1 e 0 para a variavel binaria, seja usado Z, = a + bD h em que D, — 1 
eO, a — 2 s b — 3. Compare os resultados obtidos. 

9.20. Continuando com a regressao poupan 5 a-renda (9.5.4), suponha que voce tivesse de atribuir 
Dj — 0 para observances no segundo periodo c /), = 1 para observances no primeiro periodo. 
Como os resultados da Equapao (9.5.4) mudariam? 

9.21. Use os dados da Tabela 9.2 e considere o modelo a seguir: 

In Poupannas,-= fi] + In Renda,- fi 2 + In Di + u, 

em que In e o logaritmo natural eD, = 1 para 1970-1981 e 10 para 1982-1995. 

a. Qual a logica de atribuir valores binarios como sugerido? 

b. Estime o modelo precedente e interprete os resultados obtidos. 

c. Quais sao os valores do intercepto da funcao poupanna nos dois subperiodos e como voce 
os interpretaria? 

9.22. Retomando os dados de vendas trimestrais de eletrodomesticos da Tabela 9.3, considere o 
modelo a seguir: 

Vendas, = oq + a 2 D 2 i + oi^Dy + ot^Dm + h,- 


MUKHERJEE, Chandan; WHITE, Howard; Marc WUYTS, Howard. Econometrics and data analysis for developing 
countries. Londres: Routledge, 1998. p. 372-375. Notapoes adaptadas. 



Capftulo 9 Modelos de regressao com variaveis bindrias ( dummies ) 321 


em que os D sao variaveis binarias que assumem os valores 1 e 0 para o perfodo que vai do 
segundo ao quarto trimestre. 

a. Calcule o modelo anterior para lavadoras de pratos, trituradores de lixo e lavadoras de roupas, 
separadamente. 

b. Como os coeficientes angulares estimados seriam interpretados? 

c. Como seriam usados os a estimados para dessazonalizar os dados de vendas para cada 
eletrodomestico? 

9.23. Estime novamente o modelo no Exercicio 9.22 adicionando ao regressor gastos com bens du- 
raveis. 

a. Ha diferenga nos resultados da regressao obtidos no Exercicio 9.22 e os deste exercicio? Se 
houver, o que explica a diferenga? 

b. Se ha sazonalidade nos gastos com bens duraveis, como poderiamos explica-la? 

9.24. A Tabela 9.9 apresenta dados sobre eleigoes presidenciais nos Estados Unidos, realizadas a 
cada quatro anos, de 1916 a 2004. 


TABELA 9.9 

Eleigoes presidenciais 
dos Estados Unidos, 
1916-2004 


Obs. 

Ano 

V 

1 N 

D 

c 

R 

N 

P 

1 

1916 

0,5168 

0 

1 

2,229 

1 

3 

4,252 

2 

1920 

0,3612 

1 

0 

-11,46 

1 

5 

16,535 

3 

1924 

0,4176 

0 

-1 

-3,872 

-1 

10 

5,161 

4 

1928 

0,4118 

0 

0 

4,623 

-1 

7 

0,183 

5 

1932 

0,5916 

0 

-1 

-14,9 

-1 

4 

7,069 

6 

1936 

0,6246 

0 

1 

11,921 

1 

9 

2,362 

7 

1940 

0,55 

0 

1 

3,708 

1 

8 

0,028 

8 

1944 

0,5377 

1 

1 

4,119 

1 

14 

5,678 

9 

1948 

0,5237 

1 

1 

1,849 

1 

5 

8,722 

10 

1952 

0.446 

0 

0 

0,627 

1 

6 

2,288 

11 

1956 

0,4224 

0 

-1 

-1,527 

-1 

5 

1,936 

12 

1960 

0,5009 

0 

0 

0,114 

-1 

5 

1,932 

13 

1964 

0,6134 

0 

1 

5,054 

1 

10 

1,247 

14 

1968 

0,496 

0 

0 

4.836 

1 

7 

3,215 

15 

1972 

0,3821 

0 

-1 

6,278 

-1 

4 

4,766 

16 

1976 

0,5105 

0 

0 

3,663 

-1 

4 

7,657 

17 

1980 

0,447 

0 

1 

-3,789 

1 

5 

8,093 

18 

1984 

0,4083 

0 

-1 

5,387 

-1 

7 

5,403 

19 

1988 

0,461 

0 

0 

2,068 

-1 

6 

3,272 

20 

1992 

0,5345 

0 

-1 

2,293 

-1 

1 

3,692 

21 

1996 

0,5474 

0 

1 

2,918 

1 

3 

2,268 

22 

2000 

0,50265 

0 

0 

1,219 

1 

8 

1,605 

23 

2004 

0,51233 

0 

1 

2,69 

-1 

1 

2,325 


Notas: 


Ano = ano das eleigoes 

V = participagao dos democratas na votagao bipartidaria 

W = variavel indicador (1 se as eleigoes forem de 1920, 1944 e 1948; e 0 para outros casos) 

D = variavel indicador (1 se um candidate democrata estiver disputando a eleigao; -1 se o candidate for republicano) 

C = taxa de crescimento do PIB per capita real nos 3 primeiros trimestres do ano de eleigao. 

R = variavel indicador (1 se houver democrata candidate a reeleigao; -1 se o candidate for republicano 

N = numero de trimestres nos 15 primeiros trimestres da administragao em que a taxa de crescimento do PIB per capita real 
for superior a 3,2% 

P = valor absolute da taxa de crescimento do deflator do PIB nos 15 primeiros trimestres da administragao. 


* Estes dados foram compilados originalmente por Ray Fair da Universidade de Yale, que faz provisoes dos resul¬ 
tados das eleigoes presidenciais ha varios anos. Os dados sao reproduzidos de CHATTERJEE, Samprit; HADI, Ali 
S.; PRICE, Bertram. Regression analysis by example. 3. ed. Nova York: John Wiley & Sons, 2000, p. 150-151, e 
atualizados de http://fairmodel.econ.yale.edu/rayfair/pdf/2006CHTM.HTM. 
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a. Usando os dados da Tabela 9.9, desenvolva um modelo adequado para prever a participa- 
gao dos democratas nos votos presidenciais, que envolvem dois partidos. 

b. Como usariamos este modelo para prever o resultado de uma eleigao presidencial? 

c. Chatterjee et al. sugeriram considerar o modelo a seguir como modelo experimental para 
prever as eleigoes presidenciais: 

V = £ 0 + P\I + P 2 D+ p 3 W + Pa(GI)+ p 5 P+ p 6 N + u 

Estime este modelo e comente os resultados em relagao aos obtidos no modelo que voce esco- 
lheu. 

Retome a regressao (9.6.4). Teste a hipotese de que a taxa de aumento dos ganhos medios por 
hora com relagao a escolaridade difere por genero e raga. ( Dica: use variaveis binarias multi- 
plicativas.) 

Retome a regressao (9.3.1). Como poderlamos modificar o modelo para descobrir se ha intera- 
gao entre as variaveis binarias para o genero e para a regiao de residencia? Apresente os resul¬ 
tados com base neste modelo e compare-os com os da Equagao (9.3.1). 

No modelo Y t — p l + p 2 Z>, + u b seja D, — 0 para as 40 primeiras observagoes e D t = 1 para as 
60 observagoes remanescentes. Sabe-se que M, tem media zero e uma variancia de 100. Quais 
os valores medios e as variancias dos dois conjuntos de observagoes?* 

Retome a regressao de poupanga-renda dos Estados Unidos discutida neste capltulo. Como 
alternativa a Equagao (9.5.1), considere o modelo a seguir: 

In Y t — P\ + P 2 D 1 + P 3 X t + Pn{D t X t ) + u t 
em que Tea poupanga e X, a renda. 

Calcule o modelo anterior e compare os resultados com os da Equagao (9.5.4). Qual o melhor 
modelo? 

b. Como voce interpretaria o coeficiente binario neste modelo? 

c. Como veremos no capltulo sobre heterocedasticidade, muito frequentemente uma transfor- 
magao logaritmica da variavel dependente reduz a heterocedasticidade nos dados. Veja se 
e esse o caso no exemplo, efetuando a regressao de In de Y contra X para os dois perlodos 
e veja se as variancias dos erros estimados dos dois perlodos sao iguais, do ponto de vista 
estatistico. Em caso afirmativo, o teste de Chow pode ser usado para combinar os dados da 
maneira indicada neste capltulo. 

9.29. Retome o exemplo dos assalariados indianos (Segao 9.12) e os dados da Tabela 9.7.' Lembre-se 
de que as variaveis sao definidas como se segue: 

RS = renda semanal em rupias 
Idade = em anos 

D„ en — 0 para homem e 1 para mulher 

DE 2 — uma variavel binaria com o valor de 1 para trabalhadores com primeiro grau completo 
DE 2 = uma variavel binaria com o valor de 1 para trabalhadores com segundo grau completo 
DE 4 — uma variavel binaria com o valor de 1 para trabalhadores com escolaridade superior 
ao segundo grau 

DPT — uma variavel binaria com o valor de 1 para trabalhadores com empregos permanen- 
tes e um valor de 0 para trabalhadores temporarios 


* Este exemplo e adaptado de KENNEDY, Peter. A guide to econometrics. 4 th ed. Cambridge, Mass.: MIT Press, 
1998. p. 347. 

t Dados extraldos de MUKHERJEE, Chandan; WHITE, Howard; WUYTS Marc. Econometrics and data analysis for 
developing countries. Londres: Toutledge Press, 1998. Apendice. 


9.25. 

9.26. 

9.27. 

9.28. 
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A categoria de referenda sao trabalhadores do sexo masculino com primeiro grau incompleto 
e empregos temporaries. 

Na Segao 9.12, os termos de interagao foram criados entre as variaveis escolaridade (DE 2 , DE 3 
e DE A ) e a variavel genero (D gea ). O que acontece se criamos termos de interagao entre as va¬ 
riaveis binarias escolaridade e a variavel binaria funcionario permanente (DPT)? 

a. Calcule o modelo prevendo In RS contendo as variaveis binarias idade, genero, escolarida¬ 
de e os tres novos termos de interagao: DE 2 x DPT, DE 3 x DPT e DE A x DPT. Parece 
haver um efeito de interagao significativo entre os novos termos? 

b. Ha diferenga significativa entre trabalhadores com nivel de escolaridade ate o primario e 
aqueles sem primeiro grau completo? Avalie isso com relagao a variavel binaria escolari¬ 
dade quanto ao termo de interagao e explique os resultados. O que dizer da diferenga entre 
trabalhadores com segundo grau completo e aqueles com primeiro grau incompleto? Qual 
a diferenga entre os que tem mais que o grau secundario comparados aos que nao tem o 
primeiro grau? 

c. Agora avalie os resultados de retirarem-se as variaveis binarias de escolaridade do modelo. 
Os termos de interagao tem significancia alterada? 


Regressao semilogantmica com regressor binario 

Na Segao 9.10 notamos que nos modelos do tipo 



In Yi = fa + f} 2 Di 


( 1 ) 


a variagao relativa de Y (isto e, sua semielasticidade), com relagao ao regressor binario que toma valores de 1 
ou 0, pode ser obtida como (antilogaritmo de fa) — 1 vezes 100, ou seja 


(e fc - 1) x 100 


( 2 ) 


A prova e a seguinte: uma vez que In e exp (= e) sao fungoes inversas, podemos escrever a Equagao (1) 
como: 


In Yi = ^ + ln(e feA ) 


(3) 


Agora, quando D = 0, e^ 2 °> = 1 e quando D = 1, e^ 2 °' — e^ 2 . Portanto, ao passar do estado 0 para o estado 1, 
In Yj vai'ia de (e^ 2 — 1). Mas uma variagao no In de uma variavel e uma variagao relativa, a qual, apos a multi- 


plicagao por 100 torna-se uma variagao percentual. Portanto, a variagao percentual e (e^ 2 — 1) x 100, como se 
afirmou. ( Nota: ln f e = 1, isto e, o logaritmo de e na base eel, assim como o logaritmo de 10 na base 10 e 1. 
Lembre-se de que o logaritmo na base e e chamado logaritmo natural e que o log na base 10 e chamado de 
logaritmo comum. 




Parte 


Relaxamento das hipoteses 
do modelo classico 



Na Parte I, realizamos uma discussao aprofundada do modelo de regressao linear normal classico 
e mostramos como ele pode ser usado para lidar com problemas gemeos de inferencia estatfstica, a 
saber, a estimapao e o teste de hipoteses, bem como os problemas de previsao. Mas lembre-se de que 
esse modelo baseia-se nas diversas hipoteses simplificadoras, indicadas a seguir: 

Hipotese 1. O modelo de regressao e linear nos parametros. 

Hipotese 2. Os valores dos regressores, os X, sao fixos, ou valores de X sao independentes do 
termo de erro. Aqui, isso significa que exigimos covariancia zero entre m, e cada 
variavel X. 

Hipotese 3. Para os X dados, o valor medio do erro m, e zero. 

Hipotese 4. Para os X dados, a variancia de m, e constante ou homocedastica. 

Hipotese 5. Para os X dados, nao ha autocorrela 5 ao, nem correlapao serial, entre os termos de erro. 

Hipotese 6. O numero de observa£6es n deve ser maior que o numero de parametros a serem es- 
timados. 

Hipotese 7. Deve haver variai^ao suficiente nos valores das variaveis X. 

Incluimos tambem as tres hipoteses a seguir, nesta parte do texto: 

Hipotese 8. Nao ha colinearidade exata entre as variaveis X. 

Hipotese 9. O modelo esta especificado corretamente, logo nao ha vies de especificaqiao. 

Hipotese 10. O termo estocastico (de erro) u, e distribuido normalmente. 

Antes de prosseguirmos, observemos que a maioria dos livros-texto apresenta menos de 10 hipo¬ 
teses. Por exemplo, as hipoteses 6 e 7 sao presumidas, sem serem apresentadas explicitamente. Deci- 
dimos inclui-las, porque distinguir as condipoes exigidas para que os minimos quadrados ordinarios 
(MQO) tenham propriedades estatisticas desejaveis (como ser MELNT) e as condi^oes exigidas para 
que os MQO sejam uteis faz sentido. Por exemplo, os estimadores de MQO sao MELNT (melhores 
estimadores lineares nao tendenciosos) mesmo que a hipotese 7 nao seja satisfeita. Mas, nesse caso, 
os erros padrao dos estimadores de MQO serao grandes em relafao a seus coeficientes (as razoes t 
serao pequenas), dificultando a avaliai^ao da contribuiqiao de um ou mais regressores a soma dos 
quadrados explicados. 

Como nota Wetherill, na pratica, dois grandes tipos de problemas surgem ao aplicar o modelo de 
regressao linear classico: (1) aqueles que se devem a hipoteses sobre a cspccifica^ao do modelo e 
sobre os termos de erro e (2) aqueles que se devem a suposipoes sobre os dados. 1 Na primeira 


1 WETHERILL, C. Barrie. Regression analysis with applications. Nova York: Chapman and Hall, Nova York, 1986. p. 14-15. 
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categoria estao as Hipoteses 1, 2, 3, 4, 5, 9 e 10. Na segunda incluem-se as Hipoteses 6, 7 e 8. Alem 
disso, problemas relativos aos dados, como outliers (observa£6es atfpicas ou incomuns) e erros de 
medida nos dados tambem se incluem na segunda categoria. 

Com relafao aos problemas decorrentes das hipoteses sobre termos de erro e as cspccificagocs de 
modelo, surgem tres questoes importantes: (1) Quanto podemos nos afastar de uma hipotese antes 
que isto venha causar um problema serio? Por exemplo, se m, nao tiverem uma distribu^ao normal 
exata, que nivel de afastamento dessa hipotese podemos aceitar antes que a propriedade MELNT dos 
estimadores de MQO seja invalidada? (2) Como descobrimos se determinada hipotese e, de fato, 
violada em um caso concreto? Assim, como verificamos se os termos de erro estao normalmente 
distribufdos em uma aplicagao? Ja discutimos os testes de normalidade estatfstica A 2 de Anderson- 
-Darling e o de Jarque-Bera. (3) Que medidas podemos tomar se uma ou mais hipoteses forem 
falsas? Por exemplo, se for constatado que a hipotese de homocedasticidade e falsa em uma aplica- 
5 ao, o que fazemos entao? 

Com relac^ao aos problemas atribuidos as hipoteses sobre os dados, tambem enfrentamos questoes 
semelhantes. (1) Em que medida determinado problema e serio? Por exemplo, a muticolinearidade e 
um problema tao grave que torna a estimagao e a inferencia muito diffceis? (2) Como descobrimos a 
gravidade do problema com os dados? Por exemplo, como decidimos se a inclusao ou exclusao de 
uma observable ou observa£6es que podem representar discrepancias farao diferen£a relevante na 
analise? (3) Alguns dos problemas com dados podem ser facilmente corrigidos? Pode-se ter acesso 
aos dados originais para descobrir de onde surgem os erros de medida nos dados? 

Infelizmente, nao se pode dar respostas satisfatorias a todas essas perguntas. No restante da Parte 2, 
examinaremos algumas das hipoteses mais detalhadamente, mas nem todas serao examinadas por 
completo. Em particular, nao apresentaremos uma discussao aprofundada das Hipoteses 2, 3 e 10, 
pelas seguintes razoes: 

Hipotese 2: Regressores fixos versus estocasticos 

Lembre-se de que nossa analise de regressao baseia-se na hipotese de que os regressores nao sao 
estocasticos e assumem valores fixos em amostragem repetida. Ha uma boa razao para essa estrate- 
gia. Ao contrario de pesquisadores nas ciencias exatas, como observado no Capitulo 1, os economis- 
tas em geral nao tem controle sobre os dados que usam. Com mais frequencia, os economistas 
dependent de dados secundarios, ou seja, dados coletados por terceiros, como o governo e organizacoes 
privadas. A estrategia pratica a seguir e pressupor que, para o problema em questao, os valores das 
variaveis explanatorias sao dados, embora as proprias variaveis possam ser intrinsecamente estocas- 
ticas ou aleatorias. Logo, os resultados da analise de regressao sao condicionados a esses valores 
dados. 

Mas suponha que nao possamos considerar os X como verdadeiramente nao estocasticos ou fixos. 
E esse o caso de regressores aleatorios ou estocasticos. Agora, temos uma situacjao complicada: os 
Uj sao, por definic^ao, estocasticos. Se os X tambem forem estocasticos, deveremos especificar como 
os X e os Uj sao distribuidos. Se nos dispusermos a aceitar a Hipotese 2 (isto e, os X, embora aleato¬ 
rios, sao distribufdos independentemente, ou pelo menos nao correlacionados a «,), entao, para todos 
os fins praticos, poderemos continuar a operar como se os X fossem nao estocasticos. Como observa 
Kmenta: 

Assim, o relaxamento da hipotese de que X e nao estocastico e a substituigao dela pela hipotese de que 
X e estocastico, mas independente de [u\, nao muda as propriedades desejaveis e a viabilidade da es- 
timaqao dos mmimos quadradosr 


2 KMENTA, Jan. Elements of econometrics. 2. Ed. Nova York: Macmillan, 1986. p. 338. (Grifo do original.) 
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Portanto, manteremos a Hipotese 2 ate lidarmos com modelos de equagoes simultaneas na Parte 4. 3 
Tambem, faremos uma breve discussao de regressores nao estocasticos no Capftulo 13. 


Hipotese 3: Valor medio zero de u t 

Lembre-se do modelo de regressao linear com k variaveis: 

Yi = 1 + P 2 X 2 i + PiX 3i + ■ ■ ■ + P k X ki + Ui 


( 1 ) 


Agora suponhamos que 


/’' { u 1 1 X'2i , X 3 j, ..., Si j ) — w 


( 2 ) 


em que w e uma constante; note no modelo padrao que w = 0, mas agora consideraremos qualquer 
constante. 

Utilizando a expectativa condicional da Equagao (1), obtemos 


E{Y.\X 2i , X 3i ,X kl ) = fa + p 2 X 2l + p 3 X 3i + ■■■+ p k X k , + w 


( 3 ) 


- (^i + w) + p 2 X 2i + p 3 X 3i + ■ • ■ + p k X k i 
= a + p 2 X 2i + fi 3 X 3i + -1- p k X ki 


em que a = w) e que, ao utilizarmos as expectativas, e preciso observar que os X sao tratados 
como constantes. (Por que?) 

Portanto, se a Hipotese 3 nao for satisfeita, veremos que nao podemos estimar o intercepto origi¬ 
nal Pi, o que obtemos e a, que content p x e E(w,) = w. Em resumo, obtemos uma estimativa viesada 

de Pi- 

Mas, como observamos em varias ocasioes, em muitas situagoes o termo de intercepto, p h e de 
pouca importancia; mais significativos sao os coeficientes angulares, que permanecem nao afetados 
mesmo quando a Hipotese 3 e violada. 4 Alem disso, em muitas aplicagoes, o termo de intercepto nao 
tem interpretagao flsica. 

Hipotese 10: normalidade de u 

Esta hipotese nao e essencial se nosso objetivo for apenas a estimagao. Como visto no Capftulo 3, 
os estimadores de MQO sao MELNT, independentemente de os m, serem distribufdos normalmente 
ou nao. Com a hipotese da normalidade, no entanto, fomos capazes de estabelecer que os estimadores 
de MQO dos coeficientes de regressao seguem a distribuigao normal, que (n — k) o 2 lo 2 tem a distri- 
buigao x 2 e que se pode usar os testes t e F para verificar varias hipoteses estatisticas, independente¬ 
mente do tamanho da amostra. 


3 Um aspecto tecnico pode ser notado aqui. Em vez da forte hipotese de que os X e os u sao independentes, po¬ 
demos usar a hipotese mais fraca de que os valores das variaveis Xe u nao sao correlacionados contemporanea- 
mente (isto e, no mesmo ponto no tempo). Nesse caso, os estimadores de MQO podem ser viesados (ou 
tendenciosos) mas sao consistentes, isto e, a medida que o tamanho da amostra aumenta indefinidamente, os 
estimadores convergem para seus verdadeiros valores. Se, no entanto, os X e u sao correlacionados contempo- 
raneamente, os estimadores de MQO sao viesados e inconsistentes. No Capftulo 17 mostraremos como o me- 
todo de variaveis instrumentais as vezes pode ser usado para obter estimadores consistentes nessa 
situagao. 

4 E muito importante notar que essa afirmagao so sera verdadeira se E(Uj) = w para cada i. Entretanto, se £(u,) = w u 
ou seja, uma constante diferente para cada /, os coeficientes angulares parciais podem ser viesados bem como 
inconsistentes. Nesse caso, a violagao da Hipotese 3 sera crftica. Para mais demonstragoes e detalhes, veja 
SCHMIDT, Peter. Econometrics. Nova York: Marcel Dekker, 1976. p. 36-39. 
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Mas, o que acontece se os u, nao forem distribufdos normalmente? Contamos com a seguinte 
extensao do teorema do limite central; lembre-se de que recorremos ao teorema do limite central para 
justificar a hipotese de normalidade: 

Se os tennos de erro [«,■] forem independentes e distribufdos identicamente com media zero e variancia 
[constante] cr 2 e se as variaveis explanatorias forem constantes em amostras repetidas, os coeficientes 
dos estimadores de MQ[0] serao assintoticamente normalmente distribufdos com medias iguais aos fi 
correspondentes. 5 

Portanto, os procedimentos usuais de teste — os testes t e F — serao validos assintoticamente, 
isto e, em grandes amostras, mas nao em pequenas ou Anitas. 

Saber que, se os termos de erro nao forem distribufdos normalmente, mesmo assim os estimado¬ 
res de MQO serao normalmente distribufdos assintoticamente (sob a hipotese de variancia homoce- 
dastica e X fixos) e de pouca serventia para os economistas, que com frequencia nao se dao ao luxo 
de terem dados obtidos em grandes amostras. Portanto, a hipotese de normalidade toma-se extrema- 
mente importante para fins de teste de hipoteses e previsao. Logo, com os problemas gemeos de esti- 
ma<pao e do teste de hipoteses em mente, e dado o fato de que pequenas amostras sao a regra e nao a 
exceipao na maioria das analises economicas, continuaremos a usar a hipotese da normalidade. 6 (Veja 
a Seipao 13.12 do Capitulo 13.) 

Evidentemente, isso significa que quando lidamos com uma amostra finita, devemos testar expli- 
citamente a hipotese da normalidade. Ja consideramos os testes de normalidade de Anderson-Darling 
e Jarque-Bera. O leitor e fortemente incentivado a aplicar estes e outros testes de normalidade aos 
residuos de regressao. Lembre-se de que, nas amostras finitas sent a hipotese de normalidade, as es- 
tatfsticas habituais 1 e F podem nao seguir as distributes t e F. 

Ficamos, entao, com as Hipoteses 1, 4, 5, 6, 7, 8 e 9. As Hipoteses 6, 7 e 8 estao intimamente re- 
lacionadas e serao discutidas no Capitulo 10, sobre multicolinearidade; a Hipotese 4 e vista no Capf- 
tulo 11, sobre heterocedasticidade; a Hipotese 5 e examinada no Capitulo 12, sobre autocorrckupao; e 
a Hipotese 9 e apresentada no Capitulo 13, sobre especifica?ao de modelo e teste de diagnostico. 
Devido a natureza especializada e as exigencias matematicas, a Hipotese 1 e discutida como topico 
especial na Parte 3 (Capitulo 14). 

Por motivos pedagogicos, em cada um desses capitulos seguimos um formato comum, a saber: (1) 
identificamos a natureza do problema; (2) examinamos suas consequencias; (3) sugerimos metodos 
para detectar o problema; e (4) apresentamos medidas corretivas que possam gerar estimadores que 
possuam as propriedades estatfsticas desejaveis, discutidas na Parte 1. 

Cabe uma advertencia: como ressaltamos antes, nao dispomos de respostas satisfatorias a todos os 
problemas que surgem da viola£ao de hipoteses do modelo classico de regressao linear. Alem disso, pode 
haver mais de uma solu£ao a determinado problema, e com frequencia nao esta claro qual e o melhor 
metodo. Assim, vies da especificatpao, multicolinearidade e heterocedasticidade podem coexistir em uma 
aphca 5 ao, e nao ha um teste unico, onipotente, que resolva todos os problemas ao mesmo tempo. 7 Alem 
disso, um teste que tenha sido usado em determinada epoca pode nao ser mais empregado hoje, por ter 
sido encontrada alguma falha. E assim que a ciencia progride e a econometria nao e exce 9 ao. 


5 THEIL, Henri. Introduction to econometrics. Englewood Cliffs, NJ: Prentice-Hall, 1978. p. 240. Deve-se notar que 
a hipotese de X fixos e a constante o 2 sao cruciais para este resultado. 

6 A proposito, observe que os efeitos do afastamento da normalidade e topicos relacionados sao discutidos com 
frequencia sob o topico de estimafao robusta na literatura especffica, um assunto que vai alem do escopo 
deste livro. 

7 Isto nao e por falta de tentativas. Veja BERA, A. K.; JARQUE, C. M. "Efficient tests for normality, homocedasticity and 
serial independence of regression residuals: Monte Carlo evidence". Economic Letters, 1981. v. 7, p. 313-318. 



Capitulo 

Multicolinearidade: o que 
acontece se os regressores 
estiverem correlacionados? 

Nao ha expressao mais inadequada, tanto em textos de econometria quanto na literatura aplicada, do 
que “problema de multicolinearidade”. E inegavel que muitas variaveis explanatorias sao altamente 
colineares. E esta absolutamente claro que ha experimentos projetados X’X [a matriz de dados] que 
seriam preferfveis aos naturais que nos sao oferecidos [a amostra que temos em maos]. Mas, reclamar 
da aparente maldade da natureza nao e algo de todo construtivo, e as corre§oes ad hoc do projeto, como 
a regressao por etapas ( stepwise ) ou a regressao ridge podem ser inadequadas, com resultados desastro- 
sos. Melhor seria aceitarmos o fato de que nossos nao experimentos [os dados nao coletados de acordo 
com experimentos planejados] as vezes nao nos dao muitas informapoes sobre os parametros de inte- 
resse. 1 

A Hipotese 8 do modelo classico de regressao linear afirma que nao ha multicolinearidade entre 
os regressores incluidos no modelo de regressao. Neste capitulo examinaremos essa hipotese buscando 
respostas as seguintes perguntas: 

1. Qual a natureza da multicolinearidade? 

2. A multicolinearidade e realmente um problema? 

3. Quais sao suas consequencias praticas? 

4. Como e detectada? 

5. Que medidas podem ser tomadas para atenuar o problema da multicolinearidade? 

Neste capitulo tambem discutiremos a Hipotese 6 do modelo classico de regressao linear: nao 
importa qual seja, o numero de observa£6es na amostra deve ser superior ao numero de regressores; 
e examinaremos a Hipotese 7, que exige variabilidade suficiente nos valores dos regressores, pois 
estao intimamente relacionados as hipoteses de inexistencia de multicolinearidade. Arthur Goldberger 
batizou a Hipotese 6 de problema da micronumerosidade , 2 que simplesmente significa amostra 
pequena. 



1 LEARNER, Edward E. "Model choice and specification analysis." In: GRILICHES, Zvi; INTRILIGATOR, Michael D. 
(Eds.). Handbook of econometrics. Amsterda: North Holland Publishing Company, 1983. v. I, p. 330-301. 

2 Veja seu livro A course in econometrics. Cambridge, Mass.: Harvard University Press, 1991. p. 249. 
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3BO Parte Um Modelos de regressao com equagao unica 


10.1 A natureza da multicolinearidade 

O termo multicolinearidade deve-se a Ragnar Frisch. 3 Originalmente, significava a existencia de 
uma relagao linear “perfeita” ou exata entre algumas ou todas as variaveis explanatorias do modelo 
de regressao. 4 No caso de regressao com k variaveis explanatorias X h X 2 ,..., X k (em que Xj = 1 para 
todas as observa 9 oes, de modo que permita o termo de intercepto), diz-se existir lima relapao linear 
exata se a seguinte cond^ao for satisfeita: 

Aj X\ + X 2 X 2 4- ■ • • + X k X k ~ 0 (10.1.1 ) 

em que X h X 2 ,..., X k sao constantes tais que nem todas sao simultaneamente zero. 5 

Hoje, no entanto, o termo multicolinearidade e usado em um sentido mais amplo, para incluir o 
caso de multicolinearidade perfeita, como mostra a Equa 9 ao (10.1.1), bem como o caso em que as 
variaveis X estao intercorrelacionadas, mas nao perfeitamente, como se segue: 6 

X { Xi + X 2 X 2 + ■ ■ ■ + X 2 X k + Vi = 0 (10.1.2) 

em que v, e um termo de erro estocastico. 

Para entender a dilcrcnca entre multicolinearidade perfeita e menos que perfeita, suponha, por 
exemplo, que X 2 ^ 0. Entao, a Equagao (10.1.1) pode ser escrita como 

X 2i = - ^-X u - ^X 3i - ^X ki (10.1.3) 

x 2 x 2 x 2 

a qual mostra como X 2 tem uma rela 9 §o linear exata com outras variaveis ou como pode ser derivado 
de uma combina 9 ao linear de outras variaveis X. Nessa situa 9 ao, o coeficiente de correla 9 ao entre a 
variavel X 2 e a combina 9 ao linear do lado direito da Equa 9 ao (10.1.3) sera a unidade. 

Do mesmo modo, se X 2 ^ 0, a Equa 9 ao (10.1.2) pode ser escrita como 

A.] X k 1 

X 2i = - -±X U ~ - -±X U - —v t (10.1.4) 

x 2 x 2 x 2 x 2 

que mostra que X 2 nao e uma combina 9 ao linear exata de outras variaveis X, porque tambem e deter- 
minado pelo termo de erro estocastico v,. 

Como exemplo numerico, vejamos os seguintes dados hipoteticos: 


x 2 

*3 

*3 

10 

50 

52 

15 

75 

75 

18 

90 

97 

24 

120 

129 

30 

150 

125 


3 FRISCH, Ragnar. Statistical confluence analysis by means of complete regression systems. Institute of Economics, Oslo 
University, publ. n. 5, 1934. 

4 Falando estritamente, a multicolinearidade refere-se a existencia de uma relapao linear unica. Mas essa distinpao 
raramente e mantida na pratica, e a multicolinearidade refere-se a ambos os casos. 

5 As chances de obtermos uma amostra de valores em que os regressores estao relacionados desta forma sao, de 
fato, muito pequenas na pratica, exceto quando propositado, em que, por exemplo, o numero de observapoes 
e menor que o de regressores ou se um deles cai na "armadilha da variavel binaria" como discutido no Capftulo 
9. Veja o Exercfcio 10.2. 

6 Se ha apenas duas variaveis explanatorias, a intercorrelapao pode ser medida pelo coeficiente de correlagao 
simples ou de primeira ordem. Mas, se houver mais de duas variaveis X, a intercorrelapao pode ser medida pelos 
coeficientes de correlapao parcial ou pelo coeficiente de correlagao multipla R de uma variavel X com todas as 
outras variaveis X tomadas em conjunto. 
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E evidente que X 3i = 5X 2i . Portanto, ha uma colinearidade perfeita entre X 2 e X 3 , pois o coeficien- 
te de correlagao r 2 3 e igual a unidade. A variavel X * foi criada a partir de X 2 , simplesmente somando 
a ela os seguintes numeros, tirados de uma tabela de numeros aleatorios: 2, 0, 7, 9, 2. Nesse caso, ja 
nao ha colinearidade perfeita entre X 2 e X*. Contudo, as duas variaveis estao altamente correlaciona- 
das, porque os calculos mostrarao que o coeficiente de correlagao entre elas e 0,9959. 

A abordagem algebrica a multicolinearidade pode ser descrita sucintamente pelo diagrama de 
Ballentine (lembre-se da Figura 3.8, reproduzida na Figura 10.1). Nesta, os cfrculos Y, X 2 e X 3 
representam, respectivamente, as variagoes de Y (variavel dependente) e X 2 e X 3 (as variaveis 
explanatorias). O grau de colinearidade pode ser medido pela extensao da sobreposigao (area 
sombreada) dos cfrculos X 2 e X 3 . Na Figura 10.1a nao ha sobreposigao de X 2 e X 3 , nao ha colineari¬ 
dade. Na Figura 10.1 b ate 10.le, ha um grau de colinearidade que vai de “baixo” a “alto” — quan¬ 
to maior a sobrcposiyao entre X 2 e X 3 (isto e, maior a area sombreada), maior o grau de 
colinearidade. No extremo, se X 2 e X 3 estivessem totalmente sobrepostos (ou se X 2 estivesse total- 
mente dentro de X 3 , ou vice-versa), a colinearidade seria perfeita. 

Aproposito, note que a multicolinearidade, como a definimos, refere-se apenas as rela 9 oes linea- 
res entre as variaveis X. Ela nao descarta relates nao lineares entre elas. Por exemplo, considere o 
seguinte modelo de regressao: 

Y, = h + PiX, + /3 2 Xf + foX] + Ui (10.1.5) 

em que, por exemplo, Y — custo total de produgao el = produgao. As variaveis X] (produgao ao 
quadrado) el] (produgao ao cubo) sao, obviamente, relacionadas funcionalmente a X b mas arelagao e 
nao linear. Em termos estritos, modelos como a Eiquagao (10.1.5) nao violam a hipotese de nao multico¬ 
linearidade. Entretanto, em aplicagoes concretas, o coeficiente de correlagao medido em termos conven- 
cionais mostrara X h X] e X) como altamente correlacionados, o que, como mostraremos, dificultara a 
estimagao dos parametros da Equagao (10.1.5) com maior precisao (isto e, com erros padrao menores). 


FIGURA 10.1 

Visao da 

multicolinearidade 
segundo o diagrama 
de Ballentine. 





(c) Colinearidade moderada 


(d ) Alta colinearidade 


{e) Colinearidade muito alta 
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Parte Um 


Modelos de regressao com equagdo unica 


Por que o modelo classico de regressao linear pressupoe que nao ha multicolinearidade entre os 
XI O raciocinio e o seguinte: se a multicolinearidade for perfeita no sentido da Equa^ao (10.1.1), 
os coeflcientes de regressao das variaveis X serao indeterminados e seus erros padrao, infinitos. 
Se a multicolinearidade for menos que perfeita, como na Equacao (10.1.2), os coeflcientes de 
regressao, embora determinados, possuirao grandes erros padrao (em relacao aos proprios 
coeflcientes), o que significa que os coeflcientes nao podem ser estimados com grande precisao 
ou exatidao. As demonstra^oes dessas afirma^ocs estao nas se 9 oes seguintes. 

Ha varias fontes de multicolinearidade. Como observam Montgomery e Peck, a multicolinearida¬ 
de pode ocorrer devido aos seguintes fatores: 7 

1 . O metodo de coleta de dados empregado. Por exemplo, a amostragem de uma faixa limitada 
de valores pelos regressores da populate. 

2. Restrigdes ao modelo ou a populagao que esta sendo autostrada. Por exemplo, na regressao 
do consumo de eletricidade contra renda (X 2 ) e o tamanho da casa (X 3 ), ha uma restr^ao ff- 
sica na popula 9 ao, no sentido de que familias com rendas mais altas em geral tem casas 
maiores que as com rendas mais baixas. 

3. Especificaqao do modelo. Por exemplo, adicionando termos polinomiais a um modelo de 
regressao, especialmente quando a amplitude da variavel X e pequena. 

4. Um modelo sobredeterminado. Isto acontece quando o modelo tem mais variaveis explana- 
torias que o numero de observa 9 oes. Poderia ocorrer em pesquisa medica na qual pode haver 
um numero pequeno de pacientes sobre os quais sao coletadas informa 9 oes a respeito de um 
grande numero de variaveis. 

Outra razao para a multicolinearidade, principalmente nos dados de series temporais, pode ser que 
os regressores incluidos no modelo tenham uma tendencia comum: todos aumentam ou diminuem ao 
longo do tempo. Na regressao de gastos de consumo sobre renda, riqueza e popula 9 ao, os regressores 
renda, riqueza e popula 9 ao podem estar crescendo com o tempo, aproximadamente na mesma taxa, 
gerando colinearidade dessas variaveis. 


10.2 Ikstimapao na presen^a de multicolinearidade perfeita 

Anteriormente se afirmou que, no caso da multicolinearidade perfeitas os coeflcientes de regres¬ 
sao permanecem indeterminados e seus erros padrao sao infinitos. Esse fato pode ser demonstrado em 
termos do modelo de regressao com tres variaveis. Por meio da forma do desvio, em que todas as 
variaveis sao expressas como desvios de suas medias amostrais, podemos escrever o modelo de re¬ 
gressao com tres variaveis como: 


yt = @2*2 i + As*3; + «f 


Agora, do Capftulo 7 obtemos 

3 = (EH*2,)(E4) ~ (El7*3/)(E*2,'*3,-) 
(E4XE4)- (E*2,*3,) 2 

^ = (Eb^,)(E4) ~ (Eh*2,)(E*2,* 3 ,) 
( E 4 )( E 4 ) _ ( E ^^,) 2 


( 10 . 2 . 1 ) 


(7.4.7) 


(7.4.8) 


7 MONTGOMERY, Douglas; PECK, Elizabeth. Introduction to linear regression analysis. Nova York: John Wiley & 
Sons, 1982. p. 289-290. Veja tambem MASON, R. L.; GUNST, R. F.; WEBSTER, J. T. "Regression analysis and 
problems of multicollinearity." Communications in statistics A, 1975. v. 4, n. 3, p. 227-292.; GUNST, R. F.; 
MASON, R. L. "Advantages of examining multicollinearities in regression analysis." Biometrics, v. 33, p. 249-260, 
1977. 






Capftulo 10 Multicolinearidade: o que acontece se os regressores estiverem correlacionados? 333 


Suponha que X 3i — kX 2t , em que A e uma constante diferente de zero (como 2, 4, 1, 8 etc.). Substi- 
tuindo na Equagao (7.4.7), obtemos 

a = (E }’i x 2i )(E E4) - (* E y<x2i){^ E4) 

(E4)4E4) - - (E4) 2 (10.2.2) 

_ 0 
“ 0 


que e uma expressao indeterminada. O leitorpode desejar verificar se p 2 tambem e indeterminado. 8 

Por que obtemos o resultado mostrado na Equagao (10.2.2)? Lembre-se do significado de P 2 . Ele 
nos da a variagao do valor medio de Y quando X 2 varia por uma unidade, mantendo X 2 constante. 
Mas, se X 3 e X 2 forem perfeitamente colineares, nao havera como man ter X 2 constante: a medida que 
X 2 muda, X 3 tambem muda pelo fator A. Isso significa que nao ha como distinguir as influencias de 
X 2 e X 3 de uma forma separada na amostra dada: para fins praticos, X 2 e X 3 sao indistingmveis. Em 
econometria aplicada, esse problema e gravfssimo, visto que nossa intengao e isolar os efeitos par- 
ciais de cada X sobre a variavel dependente. 

Para ver isso de outro modo, substituamos X 2i = kX 2l na Equagao (10.2.1) e obteremos o seguin- 
te (veja tambem a Equagao (7.1.12)): 

Vi = PlX 2i + Pi{^X 2l ) + Ui 

= (p 2 + Xp 3 )x 2i + Ui (10.2.3) 

= ax 2 j + Ui 


em que 


a - (P2 + ^Pi) 


(10.2.4) 


Aplicando a formula dos MQO conhecida a Equagao (10.2.3), obtemos: 

« = (A + Aft) = (10.2.5) 

l -, x 2 i 

Portanto, embora possamos estimar um unico valor para a, nao ha como estimar um unico valor 
para p 2 e /J 3 ; em termos matematicos 


a=p 2 +Xj3 3 ( 10 . 2 . 6 ) 

da apenas uma equagao com duas incognitas (note que A e dado) e ha uma infinidade de solugSes para 
a Equagao (10.2.6) para os valores dados de tie A. Em termos mais concretos, seja a = 0,8 e A = 2. 
Entao, temos 

0,8 =p 2 +ip 3 ( 10 . 2 . 7 ) 

ou 

p 2 =0,8 -2Pi ( 10 . 2 . 8 ) 


8 Outra form a de ver is to e a seguinte: por definigao, o coeficiente de correlagao entre X 2 e X 3 , r 23 e 
E Ser 2 3 = h ist0 se houver colinearidade perfeita entre X 2 e X 3 , o denominador da Equa¬ 

gao (7.4.7) sera zero, tornando impossfvel estimar fl 2 (ou de /f 3 ). 
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Agora, escolhendo um valor arbitrario de /L, teremos uma solugao para /3 2 . Escolhendo outro 
valor para teremos outra solucao para fi 2 - Nao importa quanto se tente, nao ha um valor unico de /J 2 . 

Conclui-se da discussao anterior que, no caso de multicolinearidade perfeita, nao se pode obter uma 
unica solucao para os coeficientes de regressao individuals. Mas observe que e possivel obter uma unica 
solucao para combinapocs lineares desses coeficientes. A combinapao linear de (fi 2 + A/3 3 ) tem um 
valor unico estimado por a, dado o valor de A. 9 

Vale notar que, no caso da multicolinearidade perfeita, as variancias e os erros padrao de P 2 e /> 3 , 
tornados individualmente, sao infinitos. (veja o Exercicio 10.2.1.) 


10.3 Estima^ao na presen^a de multicolinearidade 
“alta”, mas “imperfeita” 

A situafao de midticolinearidade perfeita e uma situa?ao patologica extrema. Em geral, nao ha 
rela 9 ao linear exata entre as variaveis X, principalmente em dados envolvendo series temporais eco¬ 
nomicas. Voltando ao modelo de tres variaveis no formato de desvio dado na Equa?ao (10.2.1), em 
vez da multicolinearidade exata, podemos ter 


x 3 i = Xx 2 i + Vi 


(10.3.1) 


em que A ^ 0 e v, e um termo de erro estocastico tal que x 2 ,• v, = 0. (Por que?) 

Por sinal, o diagrama de Ballentines mostrado na Figura 10.1b a 10.le representa situagoes de 
colinearidade imperfeita. 

Neste caso, a estimaqiao dos coeficientes de regressao fii e A pode ser possivel. Por exemplo, 
substituindo a Equa 9 ao (10.3.1) na Equa 9 ao (7.4.7), obtemos 


T,(y>x2i){^ 2l E x 2i + E^)- {*-Y.yi x 2i+ Ey- v »)(^E-4) 

E4(a 2 E4+Ev?)-(/E4) 2 


(10.3.2) 


na qual se usa J2 x 2 i v, = 0. Uma expressao semelhante pode ser derivada para /i 3 . 

Agora, diferentemente da Equa 9 ao (10.2.2), nao ha razao para acreditar a priori que a Equa 9 ao 
(10.3.2) nao pode ser estimada. Evidentemente, se v, for suficientemente pequeno, por exemplo, mui- 
to proximo de zero, a Equa 9 ao (10.3.1) indicara colinearidade quase perfeita e estaremos de volta ao 
caso indeterminado da Equagao (10.2.2). 


10.4 Multicolinearidade: muito barulho por nada? 

Consequencias teoricas da multicolinearidade 

Lembre-se de que, se as hipoteses do modelo classico forem satisfeitas, os estimadores de MQO 
dos estimadores da regressao serao MELNT (melhores estimadores lineares nao viesados) ou MENT 
(melhores estimadores nao viesados) se a hipotese da normalidade for acrescentada. Agora podemos 
mostrar que, mesmo se a multicolinearidade for muito alta, como no caso da quase multicolinearida¬ 
de , os estimadores de MQO ainda conservarao a propriedade de melhores estimadores lineares nao 
viesados. 10 Por que toda essa confusao por causa da multicolinearidade? Como Christopher Achen 
ressalta (veja tambem a cita 9 ao de Learner no inicio deste capitulo): 


9 Na literatura econometrica, uma funjao como (/3 2 + A/3 3 ) e conhecida como uma fungao estimavel. 

10 Uma vez que a quase multicolinearidade em si nao viola as outras hipoteses listadas no Capitulo 7, os estima¬ 
dores de MQO sao os melhores estimadores lineares nao tendenciosos, como indicado la. 
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Os alunos que estao comepando a estudar metodologia as vezes se preocupam com a correlapao de suas 
variaveis independentes — o chamado problema da multicolinearidade. Mas esta nao viola nenhuma das 
hipoteses de regressao. Estimativas consistentes, nao viesadas, resultarao, e seus erros padrao serao esti- 
mados corretamente. O unico efeito da multicolinearidade e dificultar a obtenpao de estimativas dos 
coeficientes com erros padrao pequenos. Mas ter um pequeno numero de observapdes tambem gera esse 
efeito, como ter variaveis independentes com pequenas variancias. (Na verdade, teoricamente, a multi¬ 
colinearidade, poucas observaqoes e pequenas variancias das variaveis independentes sao essencialmen- 
te o mesmo problema.) Perguntar “O que devo fazer com a multicolinearidade?” e como perguntar “O 
que devo fazer se nao tenho muitas observa 9 oes?”. Nao ha resposta estatistica para essa pergunta. 11 

Para rct'orgar a importancia do tamanho da amostra, Goldberger criou o termo micronumerosi- 
dade, para contrapor a polissilaba multicolinearidade. De acordo com Goldberger, a micronumero- 
sidade exata (a contraparte da multicolinearidade exata) surge quando n, o tamanho da mostra, e 
zero, caso em que qualquer tipo de estima 9 ao e impossfvel. A quase micronumerosidade, como a 
quase multicolinearidade, surge quando o numero de observa 9 oes mal excede o numero de parame- 
tros a serem estimados. 

Learner, Achen e Goldberger estao certos em reclamar da falta de atenfao dada ao problema do 
tamanho da amostra, e da aten 9 ao indevida ao problema da multicolinearidade. Infelizmente, no tra- 
balho aplicado que envolve dados secundarios (dados coletados por algum orgao, como os dados do 
PNB coletados pelo governo), um pesquisador pode nao ser capaz de fazer muito com o tamanho da 
amostra e pode ter de enfrentar “problemas de estima 9 ao importantes que merecem ser tratados [a 
multicolinearidade] como viola 9 ao do modelo de regressao linear classico”. 12 

Em primeiro lugar, e verdade que, mesmo no caso de quase multicolinearidade, os estimadores de 
MQO sao nao viesados, mas a nao viesidade e uma propriedade de amostragem repetida ou de multia- 
mostragem. Em outras palavras, mantendo fixos os valores das variaveis X, se obtivermos amostras 
repetidas e calcularmos os estimadores de MQO para cada uma dessas amostras, a media dos valores 
da amostra convergira para os verdadeiros valores populacionais dos estimadores a medida que o 
numero das amostras aumenta. Mas isso nao diz nada sobre as propriedades dos estimadores em 
qualquer amostra dada. 

Em segundo lugar, tambem e verdade que a colinearidade nao destroi a propriedade de variancia mini¬ 
ma: na classe de todos os estimadores nao viesados, os estimadores de MQO tem variancia minima; sao 
eficientes. Contudo nao significa que a variancia de um estimador de MQO sera necessariamente pequena 
(em rela 9 ao ao valor do estimador) em qualquer amostra dada, como demonstraremos em breve. 

Terceiro, a multicolinearidade e essencialmente umfenomeno amostral (da regressao ) no sentido 
de que, mesmo que as variaveis X nao estejam relacionadas linearmente na popula 9 ao, elas podem 
estar relacionadas na amostra em questao: quando postulamos a fun 9 ao de regressao populacional ou 
teorica (FRP), acreditamos que todas as variaveis X incluidas no modelo tenham uma influencia se- 
parada ou independente sobre a variavel dependente Y. Mas pode acontecer que, em qualquer amostra 
dada que seja usada para testar a FRP, algumas ou todas as variaveis X sejam tao colineares que nao 
podemos isolar sua influencia sobre Y. E como se dissessemos que nossa amostra nos decepcionou, 
embora a teoria informe que todas as variaveis X sao importantes. Em resumo, nossa amostra pode 
nao ser “rica” o suficiente para acomodar todas as variaveis X na analise. 

Para ilustrar, retome o exemplo de consumo e rendado Capitulo 3 (Exemplo 3.1). Os economistas 
inferem teoricamente que, alem da renda, a riqueza do consumidor tambem e um determinante im- 
portante nos gastos de consumo. Assim, podemos escrever 

Consumo,- = Renda,- + /3 3 Riqueza,- + u ,- 


11 ACHEN, Christopher H. Interpreting and using regression. Beverly Hills, California: Sage Publications, 1982. 
p. 82-83. 

12 KENNEDY, Peter. A guide to econometrics. 3. ed. Cambridge, Mass.:The MIT Press, 1992. p. 1 77. 
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Mas pode acontecer de, quando obtemos dados sobre renda e riqueza, as duas variaveis terem correla- 
9 ao alta, senao perfeitas: pessoas mais ricas em geral tendem a ter rendas mais altas. Embora teorica- 
mente renda e riqueza sejam candidates logicos para explicar o comportamento dos gastos de consumo, 
na pratica (na amostra) pode ser dificil separar as influencias da renda e da riqueza sobre os gastos de 
consumo. 

Em termos ideais, para avaliarmos os efeitos individuals da riqueza e da renda sobre os gastos de 
consumo, precisamos de um nurnero suficiente de observacjoes de amostra dos individuos ricos com 
baixa renda e de individuos com alta renda e pouca riqueza (lembre-se da Hipotese 7). Embora isso 
possa ser possfvel em estudos de corte transversal (aumentando-se o tamanho da amostra), e muito 
dificil de ser obtido no trabalho com series temporais agregadas. 

Por todas essas razoes, o fato de os estimadores de MQO serem MELNT apesar da multicolineari- 
dade, pouco ajuda na pratica. Devemos ver o que acontece ou e provavel que aconte£a em qualquer 
amostra dada, um topico discutido a seguir. 


10.5 Consequencias praticas da multicolinearidade 

Em casos de quase ou de alta multicolinearidade, e muito provavel nos depararmos com as seguin- 
tes consequencias: 

1. Embora sejam os melhores estimadores lineares nao viesados, os estimadores de MQO tem 
grandes variancias e covariancias, tornando dificil uma estima^ao precisa. 

2. Devido a consequencia 1, os intervalos de confian^a tendem a ser muito mais amplos, levan- 
do a aceita£ao imediata da “hipotese nula igual a zero” (isto e, o verdadeiro coeficiente po- 
pulacional igual a zero). 

3. Tambem, devido a consequencia 1, a razao t de um ou mais coeficientes tende a ser estatistica- 
mente insignificante. 

4. Embora a razao t de um ou mais coeficientes seja estatisticamente insignificante, R 2 , a medi- 
da geral da qualidade do ajustamento, pode ser muito alto. 

5. Os estimadores de MQO e seus erros padrao podem ser sensrveis a pequenas altera 5 oes nos 
dados. 

As consequencias anteriores podem ser demonstradas como a seguir. 

Grandes variancias e covariancias dos estimadores de MQO 

Para ver grandes variancias e covariancias, lembre-se de que, para o modelo (10.2.1), as varian¬ 
cias e covariancias de e As s ^° dadas por 


var (^ 2 ) = 

a- 

(7.4.12) 

£40 - 4 3 ) 

var(/J 3 ) = 

a 2 

(7.4.15) 

£4(! - f h) 

($ 2 , A) = - 

~r 2 3cr 2 

(7.4.17) 


(! - q 2 3 )yE4 £4 


em que r 2 3 e o coeficiente de correla^ao entre X 2 e X 2 . 

E evidente por meio das Equa 5 oes (7.4.12) e (7.4.15) que, quando r 2 3 tende a 1, isto e, quando a coli- 
nearidade aumenta, as variancias dos dois estimadores aumentam, e, no limite, quando r 23 = 1 , elas sao 
infinitas. Torna-se igualmente claro pela Equagao (7.4.17) que, quando r 2 3 aumenta para 1, a covariancia 
dos dois estimadores tambem aumenta em valor absoluto. ( Nota : cov (P 2 , P 2 ) = cov (/S 3 , /J 2 )-) 
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A velocidade com a qual as variancias e covariancias aumentam pode ser vista com o fator de 

inflagao da variancia (FIV), definido como 


FIV = 


1 

0 - 4) 


(10.5.1) 


O FIV mostra como a variancia de um estimador e inflada pela presen 9 a da multicolinearidade. Quan- 
do ^23 aproxima-se de 1, o FIV aproxima-se do infinito. Ou seja, quando a colinearidade aumenta, a 
variancia de um estimador aumenta e, no limite, pode tornar-se infinita. Se nao houver colinearidade 
entre X 2 e V 3 , o FIV sera 1. Usando esta definido, podemos expressar as Equa^oes (7.4.12) e (7.4.15) 
como 


var(/S 2 ) = s-FIV (10.5.2) 

E4 

var(/? 3 ) = —^-^-FIV (10.5.3) 

E4 

que mostra que as variancias de /i 2 e /i, sao diretamente proporcionais ao FIV. 

Para ter uma ideia da rapidez com que as variancias e covariancias aumentam quando r 23 aumen¬ 
ta, considere a Tabela 10.1, que da essas variancias e covariancias para valores selecionados de r 23 . 
Como mostra a tabela, aumentos em r 23 tem um efeito notavel nas variancias e covariancias estima- 
das dos estimadores de MQO. Quando r 23 = 0,50, a var (/L) e 1,33 vezes a variancia quando r 23 e 
zero, mas, quando r 23 atinge 0,95, ela e cerca de dez vezes mais alta do que quando nao ha colineari¬ 
dade. E, de repente, um aumento de r 23 de 0,95 para 0,995 torna a variancia estimada 100 vezes 
aquela verificada quando a colinearidade e igual a zero. O mesmo efeito marcante e visto na covarian- 
cia estimada. Tudo isto pode ser visto na Figura 10.2. 

Os resultados discutidos podem ser facilmente estendidos ao modelo com k variaveis. Em tal mo- 
delo, a variancia do Ar-esimo coeficiente, como notado na Equa 9 ao (7.5.6), pode ser expressa como: 


var(/S,■) 



(7.5.6) 


em que fij = coeficiente parcial (estimado) de regressao do regressor Xj 

R 2 j — R 2 na regressao de Xj sobre as (k — 2) regressores remanescentes ( Nota : ha [k — 1] 
regressores no modelo de regressao com k variaveis.) 

E4= E(E - Xj ) 2 


Tambem podemos escrever a Equa 9 ao (7.5.6) como 


var (Pj) = 


E- 


rFIV, 


(10.5.4) 


Como podemos ver desta expressao, a var e proporcional a cr 2 e FIV, mas inversamente pro- 
porcional a E x j- Assim, var (Jij) sera grande ou pequena de acordo com tres elementos: (1) cr 2 ; (2) 
FIV; e (3) E x j- Este ultimo, que se relaciona a Hipotese 8 do modelo classico, informa que, quanto 
maior a variabilidade de um regressor, menor a variancia de seu coeficiente, supondo que os outros 
dois elementos sejam constantes e, portanto, maior a precisao com a qual esse coeficiente pode ser 
estimado. 

Antes de prosseguirmos, podemos notar que o inverso de FIV e chamado de tolerancia (TOL). 
Ou seja, 


FIV, 


TOL, = 


(i - 4) 


(10.5.5) 
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TABELA 10.1 

Efeito de aumentos de 
r 2 3 na var (/J 2 ) e na 

COV (/§ 2 , ft) 





var (p 2 )(r 23 * 0) 


Valor de r 2 3 

FIV 

var ( p 2 ) 

var (p 2 )(r 23 = 0) 

cov {p 2 , p 3 ) 

(1) 

(2) 

(3)* 

(4) 

(5) 

0,00 

1.00 

NJ 

II 

— 

0 

0,50 

1,33 

1,33 x A 

1,33 

0,67 x B 

0,70 

1,96 

1,96 x A 

1,96 

1,37 x B 

0,80 

2,78 

2,78 x A 

2,78 

2,22 x B 

0,90 

5,76 

5,26 x A 

5,26 

4,73 x B 

0,95 

10,26 

10,26 x A 

10,26 

9,74 x B 

0,97 

16,92 

16,92 x A 

16,92 

16,41 x B 

0,99 

50,25 

50,25 x A 

50,25 

49,75 x B 

0,995 

100,00 

100,00 x A 

100,00 

99,50 x B 

0,999 

500,00 

500,00 x A 

500,00 

499,50 x B 


Nota: A = 


£4 




X = vezes 

*Para verificar o efeito do aumento de r?i sobre a var (^3), note que A = a 2 / quando 7*23 = 0 , mas os 

fatores de aumento da variancia e da covariancia permanecem os mesmos. 


figura 10.2 

Comportamento da 
var (ft) como fun§ao 
de r 23 . 



Quando R j — 1 (colinearidade perfeita), TOL / = 0 e R j = 0 (nao ha colinearidade nenhuma), 
TOL, e 1. Devido a ligapao estreita entre FIV e TOL, eles podem ser usados indistintamente. 

Intervalos de confianga mais amplos 

Dados os erros padrao grandes, os intervalos de confianqa dos parametros populacionais relevan- 
tes tendem a ser maiores, como podemos ver na Tabela 10.2. Por exemplo, quando r 23 = 0,95, o in- 
tervalo de confianqa para /i 2 e maior que quando r 23 = 0 por um fator de V10.26, ou cerca de 3. 

Portanto, em casos de alta multicolinearidade, os dados da amostra podem ser compatrveis com um 
conjunto diverso de hipoteses. A probabilidade de aceitar uma hipotese falsa (erro tipo II) aumenta. 

Razoes t "insignificantes" 

Lembre-se: para testar a hipotese nula que, por exemplo, /t 2 = 0, usamos a razao t, isto e, /i 2 /ep f/J 2 ), 
e comparamos o valor de t estimado com o valor crftico de 1 na tabela t. Mas, como vimos, em casos 
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TABELA 10.2 

O efeito da 
colinearidade 
crescente no intervalo 
de confianga de 95% 
para fa: fa ± 1,96 
ep (fa) 


Nota: estamos usando a distribuigao normal, porque supomos, por conveniencia, que a 2 
seja conhecida. Dai o uso de 1,96, o fator de confianga de 95% para distribuigao normal. 

Os erros padrao correspondentes aos diversos valores r 23 sao obtidos na Tabela 10.1. 


Valor der 2 3 Intervalo de confianga de 95% para fa 

0,00 


0,50 

0,95 

0,995 

0,999 


E4 


fa ± 1,96. 
fa ± 1,96 ^033) 
fa ± 1,96 yci0.26) 
fa ± 1,96 p 00) 
fa ± 1,96^(500) 


T .*2 


£4 


£4 


£4 


de alta colinearidade, os erros padrao estimados aumentam acentuadamente, tornando os valores t 
menores. Em tais casos, aceita-se cada vez mais a hipotese nula de que o verdadeiro valor populacio- 
nal relevante e zero. 13 

Alto valor de R 2 , mas poucas razoes t significativas 

Considere o modelo de regressao linear com k variaveis: 

Yj = fa + faX 2 i + faX-a + ■ ■ ■ + faXki + u t 

Em casos de alta colinearidade, e possfvel constatar, como acabamos de notar, que um ou mais 
coeficientes angulares parciais sao insignificantes individualmente, com base no teste t. Nessas situa- 
5 oes, R 2 pode ser tao alto, por exemplo, superior a 0,9, que de acordo com o teste F podemos rejeitar 
convincentemente a hipotese de que fa = fa =■■■ = fa = 0. De fato, esse e um dos indfcios de mul¬ 
ticolinearidade: valores t insignificantes, mas um R 2 geral alto (e um valor F significativo). 

Demonstraremos esse sinal na proxima segao, mas tal resultado nao deveria ser surpreendente, 
tendo em vista nossa discussao sobre testes individuais e conjuntos apresentados no Capftulo 8. 
Como podemos lembrar, o problema real aqui sao as covariancias entre os estimadores, que, como a 
formula (7.4.17) indica, estao relacionadas as correlagoes entre os regressores. 

Sensibilidade dos estimadores de MQO e de seus erros padrao a pequenas 
alteragoes nos dados 

Contanto que a multilinearidade nao seja perfeita, e posslvel estimar os coeficientes de regressao, mas 
as estimativas e seus erros padrao tomam-se muito sensiveis ate mesmo a menor altcragao nos dados. 

Para comprovar isso, considere a Tabela 10.3. Com base nesses dados, obtemos a seguinte regres¬ 
sao multipla: 

Yi= 1,1939 + 0,4463X 2i + 0,0030Jf 3l 
(0,7737) (0,1848) (0,0851) 

/ = (1,5431) (2,4151) (0,0358) (10.5.6) 

R 2 = 0,8101 r 23 = 0,5523 

cov(fa, fa) = - 0,00868 gl = 2 


13 Em termos de intervalos de confianga, o valor de fa = 0 pertencera cada vez mais a regiao de aceitagao quan- 
do o grau de colinearidade aumentar. 
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TABELA 10.3 

Dados hipoteticos em Y , X 2 
eX 3 

TABELA 10.4 

Dados hipoteticos em Y, X 2 
eX 3 

Y 

x 2 

*3 

Y 

x 2 

Xj 

1 

2 

4 

1 

2 

4 

2 

0 

2 

2 

0 

2 

3 

4 

12 

3 

4 

0 

4 

6 

0 

4 

6 

12 

5 

8 

16 

5 

8 

16 


Aregressao (10.5.6) mostra que nenhum dos coeficientes de regressao e individualmente significa¬ 
tive aos niveis convencionais de 1% ou 5% de significance, embora (i 2 seja significativo ao nivel de 
10% com base em um teste t unicaudal. 

Agora, considere a Tabela 10.4. A unica diferenpa entre as Tabelas 10.3 e 10.4 e que o terceiro e 
o quarto valores de X 3 foram trocados. Usando os dados da Tabela 10.4, agora obtemos 

% = 1,2108 + 0,4014X2,+ 0,0270X 3 , 

(0,7480) (0,2721) (0,1252) 

'=(1,6187) (1,4752) (0,2158) (10.5.7) 

i? 2 = 0,8143 r 23 = 0,8285 

cov (&,&) = - 0,0282 gl = 2 

Como resultado de uma ligeira alterapao nos dados, vemos que /1 2 , que era estatisticamente signi¬ 
ficativo ao nivel de 10% de significance, deixou de se-lo ate em termos de nivel. Note ainda que na 
Equapao (10.5.6), a cov (/f 2 , /S 3 ) = —0,00868 enquanto na Equapao (10.5.7) ela e de —0,0282, mais 
de tres vezes maior. Todas essas alterapSes podem ser atribuidas a um aumento na multicolinearidade: 
em (10.5.6), r 23 = 0,5523, enquanto em (10.5.7) e 0,8285. 

Da mesma forma, os erros padrao de fi 2 e /ft aumentam entre as duas regressoes, um sintoma 
comum de colinearidade. 

Observamos anteriormente que, na presenpa de alta colinearidade, nao podemos estimar os coefi¬ 
cientes de regressao individuals com precisao, mas que combinapoes lineares desses coeficientes 
podem ser estimadas com maior precisao. Esse fato pode ser validado por meio das regressoes 
(10.5.6) e 10.5.7). Na primeira delas, a soma dos dois coeficientes angulares parciais e 0,4493 e na 
segunda e 0,4284, praticamente o mesmo. Nao so isso, seus erros padrao tambem sao praticamente 
os mesmos, 0,1550 em um caso e 0,1823 no outro. 14 Note, no entanto, que o coeficiente deX 3 mudou 
radicalmente, de 0,003 para 0,027. 

Consequencias da micronumerosidade 

Em uma parodia das consequencias da multicolinearidade, e com certa ironia, Goldberger cita 
consequencias semelhantes da micronumerosidade, ou seja, analise baseada em uma amostra de tama- 
nho pequeno. 15 O leitor e aconselhado a ler a analise de Goldberger para entender por que ele conside- 
ra a micronumerosidade importante como multicolinearidade. 


14 Esses erros padrao sao obtidos da formula 

ep 02 + fa) = 

Note que uma colinearidade crescente aumenta as variancias de ft e ft, mas essas variances podem ser com- 
pensadas se houver alta covariancia negativa entre as duas, como indicam nossos resultados. 

15 GOLDBERGER, op. cit., p. 248-250. 
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10.6 Um exemplo ilustrativo 


EXEMPLO 10.1 

Gastos de 
consumo em 
relagao d renda e 
a riqueza 


Para ilustrar os varios pontos destacados ate aqui, consideremos o exemplo de consumo- 
-renda da introdugao. A Tabela 10.5 content dados hipoteticos sobre consumo, renda e ri¬ 
queza. Se pressupormos que os gastos de consumo estejam linearmente relacionados a renda 
e a riqueza, entao, da Tabela 10.5, obteremos a seguinte regressao: 

Y, = 24,7747 + 0,9415X 2; - 0,0424X 3| 

(6,7525) (0,8229) (0,0807) 

t= (3,6690) (1,1442) (-0,5261) ( 10 . 6 . 1 ) 

R 2 = 0,9635 R 2 = 0,9531 gl = 7 


TABELA 10.5 

Dados hipoteticos 
sobre gastos de 
consumo Y , renda 
X 2 e riqueza X 3 


Y, S 

x 2 , $ 

X 3 , $ 

70 

80 

810 

65 

100 

1009 

90 

120 

1273 

95 

140 

1425 

110 

160 

1633 

115 

180 

1876 

120 

200 

2052 

140 

220 

2201 

155 

240 

2435 

150 

260 

2686 


TABELA 10.6 

Tabela ANOVA 
para o exemplo de 
consumo-renda- 
riqueza 


Fonte de variagao 

SQ 

gi 

QM 

Devido a regressao 

8.565,5541 

2 

4.282,7770 

Devido aos resfduos 

324,4459 

7 

46,3494 


A regressao (10.6.1) mostra que renda e riqueza juntas explicam cerca de 96% da varia- 
gao na despesa de consumo, e nenhum dos coeficientes angulares e, individualmente, esta- 
tisticamente significativo. Alem disso, a variavel riqueza nao so e estatisticamente 
insignificante, mas tambem tern o sinal errado. A priori, pode-se esperar uma relagao positiva 
entre consumo e riqueza. Embora /S 2 e ft sejam individualmente insignificantes, do ponto de 
vista estatistico, se testarmos a hipotese de que fi 2 = ft = 0 simultaneamente, essa hipotese 
podera ser rejeitada, como mostra a Tabela 10.6. Sob o pressuposto usual, obtemos 


4282,7770 

46,3494 


92,4019 


( 10 . 6 . 2 ) 


Esse valor de F, obviamente, e altamente significativo. 

E interessante examinar esse resultado geometricamente. (Veja a Figura 10.3). Com base 
na regressao (10.6.1), estabelecemos intervalos de confianga individuals com 95% de proba- 
bilidade para /3 2 e /3 3 , seguindo o procedimento usual discutido no Capftulo 8. Como mos- 
tram esses intervalos, cada um deles inclui o valor de zero. Individualmente, podemos aceitar 
a hipotese de que os dois coeficientes angulares parciais sao zero. Mas, quando estabelece¬ 
mos o intervalo de confianga conjunto para testar a hipotese de que p 2 = ft = 0/ esta nao 
pode ser aceita, ja que o intervalo de confianga conjunto, que na realidade e uma elipse, 
nao inclui a origem. 16 Como ja ressaltamos, quando a colinearidade e alta, os testes dos re¬ 
gressores individuals nao sao confiaveis; em tais casos, e o teste Fgeral que indicara se Testa 
relacionado aos varios regressores. 

( Continua ) 


16 


Como observado na Segao 5.3, o intervalo de confianga conjunto e bastante complicado. O leitor interessado 
pode consultar a referenda citada naquele capftulo. 
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EXEMPLO 10.1 

(' Continuagao ) 


Nosso exemplo mostra claramente o que a multicolinearidade faz. O fato de o teste F ser 
significativo, mas os valores t de X 2 e X 3 serem individualmente insignificantes significa que 
as duas variaveis estao tao correlacionadas que e impossfvel identificar o impacto individual 
da renda ou da riqueza sobre o consumo. Naturalmente, se fizermos a regressao de X 3 contra 
X 2< obteremos: 


X 3 , = 7,5454 + 10,1909X2/ 

(29,4758) (0,1643) 

t = (0,2560) (62,0405) R 2 = 0,9979 


( 10 . 6 . 3 ) 


o que mostra que ha uma colinearidade quase perfeita entre X 3 e X 2 . 

Agora, vejamos o que acontece se fizermos a regressao de Y contra X 2 apenas: 


Yi = 24,4545 + 0,5091 X 2 , 

(6,4138) (0,0357) 

t = (3,8128) (14,2432) R 2 = 0,9621 


( 10 . 6 . 4 ) 


Na Equagao (10.6.1) a variavel renda era estatisticamente insignificante, mas agora ela e 
altamente significativa. Se, em vez de fazer a regressao de Y contra X 2 , efetuarmos a regressao 
contra X 3 , obteremos: 


Yi = 24,411 + 0,0498X 3( 

(6,874) (0,0037) 

t= (3,551) (13,2900) R 2 = 0,9567 


( 10 . 6 . 5 ) 


FIGURA 10.3 

Intervalos de 
confianga 
individuals para f) 2 
e fa e intervalo de 
confianga conjunto 
(elipse) para f} 2 e 

ft- 


ft 



Vemos que a riqueza agora tern um impacto significativo na despesa de consumo, enquanto 
na Equagao (10.6.1) nao tinha efeito. 

As regressoes (10.6.4) e (10.6.5) mostram claramente que, em situagoes de extrema mul¬ 
ticolinearidade, excluir a variavel altamente colinear com frequencia tornara a outra variavel 
X estatisticamente significativa. Esse resultado sugere que uma forma de escapar da extrema 
colinearidade e excluir a variavel colinear, mas falaremos mais a respeito na Segao 10.8. 
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EXEMPLO 10.2 

Fungao consumo 
para os Estados 
Unidos, 1947- 
-2000 

TABELA 10.7 

Despesa de 
consumo nos 
Estados Unidos 
para o perfodo de 
1947-2000 

Fonte: veja a Tabela 
7.12. 


Agora vamos considerar um conjunto concreto de dados sobre gastos reais de consumo 
(C), renda pessoal real disponfvel (Yd), riqueza real (W) e taxa de juros real (I) para os Estados 
Unidos, no perfodo de 1947-2000. Os dados brutos sao apresentadados na Tabela 10.7. 


Ano 

C 

Yd 

W 

1 

1947 

976,4 

1035,2 

5166,815 

-10,35094 

1948 

998,1 

1090 

5280,757 

-4,719804 

1949 

1025,3 

1095,6 

5607,351 

1,044063 

1950 

1090,9 

1192,7 

5759,515 

0,407346 

1951 

1107,1 

1227 

6086,056 

-5,283152 

1952 

1142,4 

1266,8 

6243,864 

-0,277011 

1953 

1197,2 

1327,5 

6355,613 

0,561137 

1954 

1221,9 

1344 

6797,027 

-0,138476 

1955 

1310,4 

1433,8 

71 72,242 

0,261997 

1956 

1 348,8 

1502,3 

7375,18 

-0,736124 

1957 

1381,8 

1539,5 

7315,286 

-0,260683 

1958 

1393 

1553,7 

7869,975 

-0,57463 

1959 

1470,7 

1623,8 

8188,054 

2,295943 

1960 

1510,8 

1664,8 

8351,757 

1,511181 

1961 

1541,2 

1720 

8971,872 

1,296432 

1962 

1617,3 

1803,5 

9091,545 

1,395922 

1963 

1684 

1871,5 

9436,097 

2,057616 

1964 

1 784,8 

2006,9 

10003,4 

2,026599 

1965 

1897,6 

2131 

10562,81 

2,111669 

1966 

2006,1 

2244,6 

10522,04 

2,020251 

1967 

2066,2 

2340,5 

11312,07 

1,212616 

1968 

2184,2 

2448,2 

12145,41 

1,054986 

1969 

2264,8 

2524,3 

11672,25 

1,732154 

1970 

2317,5 

2630 

11650,04 

1,166228 

1971 

2405,2 

2745,3 

12312,92 

-0,712241 

1972 

2550,5 

2874,3 

1 3499,92 

-0,155737 

1973 

2675,9 

3072,3 

13080,96 

1,413839 

1974 

2653,7 

3051,9 

11868,79 

-1,042571 

1975 

2710,9 

3108,5 

12634,36 

-3,533585 

1976 

2868,9 

3243,5 

13456,78 

-0,656766 

1977 

2992,1 

3360,7 

13786,31 

-1,190427 

1978 

3124,7 

3527,5 

14450,5 

0,113048 

1979 

3203,2 

3628,6 

15340 

1,70421 

1980 

3193 

3658 

15964,95 

2,298496 

1981 

3236 

3741,1 

15964,99 

4,703847 

1982 

3275,5 

3791,7 

16312,51 

4,449027 

1983 

3454,3 

3906,9 

16944,85 

4,690972 

1984 

3640,6 

4207,6 

17526,75 

5,848332 

1985 

3820,9 

4347,8 

19068,35 

4,330504 

1986 

3981,2 

4486,6 

20530,04 

3,768031 

1987 

4113,4 

4582,5 

21235,69 

2,819469 

1988 

4279,5 

4784,1 

22331,99 

3,287061 

1989 

4393,7 

4906,5 

23659,8 

4,317956 

1990 

4474,5 

5014,2 

23105,13 

3,595025 


( Continua ) 
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EXEMPLO 10.2 

(' Continuagao ) 


TABELA 10.7 

Ano 

C 

Yd 

W 

1 

(■ Continuagao ) 

1991 

4466,6 

5033 

24050,21 

1,802757 


1992 

4594,5 

5189,3 

24418,2 

1,007439 

1993 

4748,9 

5261,3 

25092,33 

0,62479 

1994 

4928,1 

5397,2 

25218,6 

2,206002 

1995 

5075,6 

5539,1 

27439,73 

3,333143 

1996 

5237,5 

5677,7 

29448,19 

3,083201 

1997 

5423,9 

5854,5 

32664,07 

3,12 

1998 

5683,7 

6168,6 

35587,02 

3,583909 

1999 

5968,4 

6320 

39591,26 

3,245271 

2000 

6257,8 

6539,2 

38167,72 

3,57597 


Usamos o seguinte modelo para analise 


In Q = fit + folnY d t + fo\r\\N t + yS 4 / t + u t ( 10 . 6 . 6 ) 

em que In representa logaritmo. 

Nesse modelo, os coeficientes f} 2 e /J 3 dao as elasticidades de renda e riqueza, respectiva- 
mente (por que?) e p 4 a semielasticidade (por que?). Os resultados da regressao (10.6.6) sao 
apresentados na tabela a seguir. 

Dependent Variable: LOG (C) 

Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 


Coefficient Std. Error t-Statistic Prob. 


C 

LOG (YD) 

LOG (WEALTH) 

INTEREST 

0.467711 

0.804873 

0.201270 

0.002689 


0.042778 

0.017498 

0.017593 

0.000762 

-10.93343 

45.99836 

11.44060 

-3.529265 

0.0000 

0.0000 

0.0000 

0.0009 

R-squared 

0 . 

999560 

Mean dependent var. 

7.826093 

Adjusted R-squared 

0 . 

999533 

S.D. dependent var. 

0.552368 

S.E. of regression 

0 . 

011934 

Akaike info criterion 

-5.947703 

Sum squared resid. 

0 . 

007121 

Schwarz criterion 

-5.800371 

Log likelihood 

164 . 

5880 

Hannan-Quinn cariter. 

-5.890883 

F-statistic 

37832. 

59 

Durbin-Watson stat. 

1.289219 

Prob(F-statistic) 

0 . 

000000 





Note: LOG stands for natural log. 

Os resultados mostram que todos os coeficientes estimados sao altamente significativos, 
do ponto de vista estatfstico, pois seus valores p sao extremamente pequenos. Os coeficientes 
estimados sao interpretados como segue. A elasticidade da renda e sa 0,80, sugerindo que, 
mantendo as outras variaveis constantes, se a renda sobe em 1%, os gastos medios de con- 
sumo sobem cerca de 0,8%. O coeficiente de riqueza e ~ 0,20, o que significa que, se a ri¬ 
queza sobe em 1%, o consumo medio sobe apenas 0,2%, novamente mantendo-se as 
demais variaveis constantes. O coeficiente da variavel taxa de juros diz que, quando esta sobe 
em um ponto percentual, a despesa de consumo cai em 0,26%, ceteris paribus. 

Todos os regressores tern sinais que atendem as expectativas anteriores, isto e, renda e rique¬ 
za tern ambas um impacto positivo no consumo, mas a taxa de juros tern impacto negativo. 


( Continua ) 
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EXEMPLO 10.2 

( Continuagao ) 


Temos de nos preocupar com o problema da multicolinearidade neste caso? Aparente- 
mente nao, porque todos os coeficientes tern os sinais certos, cada coeficiente sendo indivi- 
dualmente significativo, do ponto de vista estatfstico, e o valor de F tambem e altamente 
significativo do ponto de vista estatfstico, sugerindo que, coletivamente, todas as variaveis 
tern um impacto significativo na despesa de consumo. O valor R 2 tambem e bem alto. 

Evidentemente, em geral ha certo grau de colinearidade entre as variaveis economicas. 
Contanto que ele nao seja exato, ainda podemos estimar os parametros do modelo. Por ora, 
tudo o que podemos dizer e que, neste exemplo, a colinearidade, se houver, nao parece ser 
tao acentuada. Mas na Segao 10.7 forneceremos testes diagnosticos para detectar a colinea¬ 
ridade e reexaminar a fungao consumo nos Estados Unidos, a fim de determinar se ela e 
afetada pelo problema da colinearidade. 


10.7 Detec^ao da multicolinearidade 

Tendo estudado a natureza e as consequencias da multicolinearidade, a pergunta natural e: como 
saber se a colinearidade esta presente em qualquer situagao dada, principalmente em modelos envol- 
vendo mais de duas variaveis explanatorias? Aqui convem relembrar a advertencia de Kmenta: 

1. A multicolinearidade e uma questao de grau e nao de tipo. A distingao significativa nao e entre a 
presenga e a ausencia de multicolinearidade, mas entre seus varios graus. 

2. Uma vez que a multicolinearidade refere-se a condigao das variaveis explanatorias que se supSe 
nao serem estocasticas, ela e uma caracteristica da amostra, e nao da populagao. 

Portanto, nao “fazemos testes para multicolinearidade”, mas, se quisermos, medimos seu grau em qualquer 
amostra especifica. 16 

Uma vez que a multicolinearidade e essencialmente um fenomeno amostral decorrente de grande 
quantidade de dados nao experimentais coletados basicamente em ciencias sociais, nao temos um 
metodo unico para detecta-la ou para medir sua forga. O que temos sao regras praticas; algumas in- 
formais e outras formais, mas, ainda assim regras praticas. Consideremos algumas delas. 

1 . R 2 alto, mas poucas razees t significativas. Como notado, este e o sintoma “classico” da mul¬ 
ticolinearidade. Se R 2 for alto, por exemplo, superior a 0,8, o teste F na maioria dos casos rejeitara a 
hipotese de que os coeficientes angulares parciais sao simultaneamente iguais a zero, mas os testes t 
individuals mostrarao que nenhum dos coeficientes angulares parciais ou poucos deles sao estatisti- 
camente diferentes de zero. Esse fato foi demonstrado claramente por nosso exemplo de consumo- 
renda-riqueza. 

Embora esse diagnostico seja sensato, sua desvantagem esta no fato de ser “forte demais, no sen- 
tido de que a multicolinearidade e considerada prejudicial somente quando todas as influencias das 
variaveis explanatorias sobre Y nao puderem ser distintas”. 17 

2. Altas correlagoes entre pares de regressores. Outra regra sugerida e que se o coeficiente de 
correlagao entre dois regressores for alto, por exempo, maior que 0,8, a multicolinearidade sera um 
problema serio. O problema desse criterio e que, embora altas correlagoes de ordem zero possam 
sugerir colinearidade, nao e necessario que sejam altas para que exista colinearidade em qualquer 
caso especifico. De um modo mais tecnico, dizemos que alias correlagdes de ordem zero sao condi- 
gao suficiente, mas nao necessaria, para a existencia da multicolinearidade, porque ela pode existir 
embora as correlagdes de ordem zero ou simples sejam comparativamente baixas (por exemplo, 
menores que 0,50). Para entender essa relagao, suponhamos o modelo de quatro variaveis: 

Yi = P\ + faXii + + P^Xm + u, 


16 KMENTA, Jan. Elements of econometrics. 2. Ed. Nova York: Macmillan, 1986. p. 431. 

17 Ibid., p. 439. 





346 


Parte Um 


Modelos de regressao com equagao unica 


e imaginemos que 


X 4 i - k 2 X 2 i + ^ 3 ^ 3 ; 


em que k 2 e k 3 sao constantes, e nao ambas iguais a zero. Obviamente, X 4 e uma combina^ao linear 
exata de X 2 e X 3 , daudo R\ 23 — 1, o coeficiente de determina 9 ao na regressao de X 4 , sobre X 2 e X 3 . 
Considerando a formula (7.11.5) do Capftulo 7, podemos escrever 



t~42 + r 43 ~ 2r 42^4 3^2 3 


1 - r 


2 

23 


(10.7.1) 


Mas, ja que i ? 423 


1 devido a colinearidade perfeita, obtemos 
r% 2 + r\ 3 - 2 r 42 r 43 r 23 


(10.7.2) 


Nao e diffcil entender que a Equa 9 ao (10.7.2) e satisfeita por r 42 = 0,5, r 43 = 0,5 e r 23 = —0,5, 
que nao sao valores muito altos. 

Em modelos que envolvam mais de duas variaveis explanatorias, a correla 9 ao simples ou de or- 
dem zero nao fornecera uma orientagao infalfvel para a presen 9 a de multicolinearidade. Evidente- 
mente, se houver apenas duas variaveis explanatorias, as correla 9 oes de ordem zero serao 
suficientes. 

3. Exame de correlates parciais. Devido ao problema de contar-se com correla 9 oes de ordem 
zero, Farrar e Glauber sugeriram que se devem examinar os coeficientes de correla 9 ao parcial . 18 As- 
sim, na regressao de Y sobre X 2 , X 3 e X 4 , um resultado em que r\ 234 e muito elevado, mas r j 2 34 , 
r 13,24 e r 2 1423 sao comparativamente baixos, pode sugerir que as variaveis X 2 , X 3 e X 4 sao estreita- 
mente intercorrelacionadas e que pelo menos uma dessas variaveis e superflua. 

Embora um estudo das correla 9 oes parciais possa ser util, nao ha garantia de que elas fomecerao uma 
orienta 9 §o infallvel a multicolinearidade, pois pode acontecer que tanto R 2 quanto as correla 9 oes parciais 
sejam suficientemente altas. Mas o mais importante e que o teste de correla 9 ao parcial de Farrar-Glauber, 
conforme mostrou C. Robert Wichers , 19 e ineficaz, uma vez que uma dada correla 9 ao parcial pode ser 
compativel com diferentes padroes de multicolinearidade. O teste de Farrar-Glauber tambem foi severa- 
mente criticado por T. Krishna Kumar 20 e por John O’Hagan e Brendam McCabe . 21 

4. Regressoes auxiliares. Uma vez que a multicolinearidade surge, porque um ou mais regresso- 
res sao combinapoes lineares aproximadas ou exatas dos outros regressores, uma forma de descobrir 
qual variavel X esta relacionada a outras variaveis X e fazer a regressao de cada X t contra as demais 
variaveis X e calcular o R 1 correspondente, que designamos como Rj, cada uma dessas regressoes e 
chamada regressao auxiliar, auxiliar em rela 9 ao a principal regressao de Y contra os X. Seguindo a 
rela 9 ao entre F e R 1 estabelecida na Equa 9 ao (8.4.11), a variavel 


F t = 


D 2 

IK Xi,X 1 XyXk 


(1 - R l. 


/(k - 2 ) 

)/(« ~ k + 1 ) 


(10.7.3) 


segue a distribu^ao F com k— 2en — k + \ graus de liberdade. Na Equa 9 ao (10.7.3) n representa o 
tamanho da amostra, k representa o numero de variaveis explanatorias que incluem o termo do inter- 


18 FARRAR, D. E.; GLAUBER, R. R. "Multicolinearity in regression analysis: the problem revisited." Review of 
Economics and Statistics, v. 49, p. 92-107. 

19 "The detection of muiticolinearity: a comment." Review of Economics and Statistics, 1975. v. 57, p. 365-366. 

20 "Muiticolinearity in regression analysis." Review of Economics and Statistics, 1975. v. 57, p. 366-368. 

21 "Tests for the severity of muiticolinearity in regression analysis: a comment." Review of Economics and Statistics, 
1975. v. 57, p. 368-370. 
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cepto e R 2 x h x 2 x 3 ...xk e o coeficiente de determinaqao na regressao da variavel X t contra as variaveis X 
remanescentes. 22 

Se o F calculado excede o F, critico no nivel de significance escolhido, considera-se que o X t e 
colinear com os outros X; se nao exceder o F, critico, diremos que nao e colinear aos outros X e, nes- 
te caso, mantemos a variavel no modelo. Se F t for estatisticamente significativo, ainda teremos de 
decidir se o X j- em questao deve ser excluido do modelo. Essa questao sera retomada na Se 9 ao 10.8. 
Mas, este metodo tem suas desvantagens, pois 

[...] se a multicolinearidade envolve apenas algumas variaveis de modo que as regressoes auxiliares nao 
demonstrem multicolinearidade extensa, os coeficientes estimados podem revelar a natureza da depen¬ 
dence linear entre os regressores. Infelizmente, se ha varias associa 9 oes lineares complexas, esse exer- 
cicio de ajustamento de curvas pode nao ter muito valor, pois sera dificil identificar as inter-rela95es 
isoladas. 23 


Em vez de testar formalmente os valores auxiliares de R 2 , podemos adotar a regra pratica de 
Klein , que sugere que a multicolinearidade so sera um problema complicado se o R 2 obtido de uma 
regressao auxiliar for maior que o R 2 geral, aquele obtido da regressao de Y contra todos os regresso¬ 
res. 24 Obviamente, como todas as demais regras praticas, esta deve ser usada com criterio. 

5. Autovalores e indice condicional. De EViews e Stata, podemos encontrar autovalores e o 
indice condicional para diagnosticar a multicolinearidade. Nao discutiremos os autovalores aqui, pois 
nos faria entrar em topicos de algebra matricial que estao alem do escopo deste livro. Desses autova¬ 
lores, no entanto, podemos derivar o que e conhecido como o numero condicional k, definido 
como 

Maximo autovalor 

k = -;--— 

Mimmo autovalor 


e o indice condicional (IC) definido como 


IC = 


Maximo autovalor 


V Minimo autovalor 


yfk 


Entao temos esta regra pratica: se k esta entre 100 e 1.000, ha multicolinearidade de moderada 
a forte; e, se for maior que 1.000, havera multicolinearidade grave. Por outro lado, se o IC ( = \[k) es- 
tiver entre 10 e 30, a multicolinearidade sera de moderada a forte e, se for maior que 30, sera grave. 

No exemplo do Apendice 7A.5, o menor autovalor e 3,786 e o maior e 187,5269, em que 
k = 187,5269/3,786 ou aproximadamente 49,53. Portanto, IC = ^49,53 = 7,0377. Tanto k quanto 
IC sugerem que nao temos um problema grave de colinearidade. Note que um autovalor baixo (em 
relatjao ao autovalor maximo) em geral indica dependencias quase lineares nos dados. 

Alguns autores acreditam que o l'ndice condicional e o melhor diagnostico disponfvel da multico¬ 
linearidade, mas essa opiniao nao e geral. Para nos, o IC e apenas uma regra, talvez um pouco mais 
sofisticada. Mas, para maiores detalhes, o leitor pode consultar as referencias. 25 

6 . Tolerancia e fator de infla^ao da variancia. Ja introduzimos TOL e FIV. Quando Rj. o coefi¬ 
ciente de determina 9 ao na regressao do regressor Xj contra os regressores remanescentes no modelo, 
aumenta no sentido da unidade, isto e, quando a colinearidade de Xj com os outros regressores au- 
menta, FIV tambem aumenta e, no limite, pode ser infinito. 


22 Por exemplo, R 2 Xl pode ser obtido efetuando-se a regressao de X 2 ; como se segue: X 2 ; = a, + X 3j + a A X 4i + ■■■ 
+ o k X kj + Uj. 

23 JUDGE, George G.; HILL, R. Carter; GRIFFITHS, William E.; LUKEPOHL, Helmut; LEE, Tsoung-Chao. Introduction 
to the theory and practice of econometrics. Nova York: John Wiley & Sons, 1982. p. 621. 

24 KLEIN, Lawrence R. An introduction to econometrics. Englewood Cliffs, NJ: Prentice-Hall, 1962. p. 101. 

25 Veja especialmente BELSLEY, D. A. KUH, E.; WELSCH, R. E. Regression diagnostics: identifying influential data and 
sources of collinearity. Nova York: John Wiley & Sons, 1980. cap. 3. (Este nao e um livro para iniciantes.) 







348 


Parte Um 


Modelos de regressao com equagdo unica 


Alguns autores, portanto, usam o FIV como indicador de multicolinearidade. Quanto maior for o 
valor de FIV,, mais “problematica” ou colinear sera a variavel X } . Como regra pratica, se o FIV, de 
uma variavel for maior que 10 (o que acontecera se R 2 for maior que 0,90), essa variavel sera tida 
como altamente colinear. 26 

Obviamente, TOL, poderia ser usado como medida de multicolinearidade tendo em vista a conexao 
estreita com FIV,. Quanto mais proximo TOL, for de zero, maior o grau de colinearidade daquela 
variavel com os outros regressores. Por outro lado, quanto mais proximo TOL, for de 1, maior a evi- 
dencia de que A, nao e colinear com os outros regressores. 

Ha quem critique o FIV (ou tolerancia) como medida de colinearidade. Como mostra a Equagao 
(10.5.4), a var (/§,) depende de tres fatores: er, x j e FIV,. Um FIV alto pode ser compensado por 
um er baixo ou um xj alto. Em outras palavras, um FIV alto nao e necessario nem suficiente para 
obter variancias e erros padrao altos. Portanto, a alta multicolinearidade, medida por um FIV alto, 
pode nao necessariamente causar erros padrao altos. Durante toda essa discussao, os termos alto e 
baixo sao usados no sentido relativo. 

7. Diagrama de dispersao. E uma boa pratica usar um diagrama de dispersao para verificar como 
as diversas variaveis estao relacionadas em um modelo de regressao. A Figura 10.4 apresenta o dia¬ 
grama de dispersao para o exemplo de consumo discutido na sec^ao anterior (Exemplo 10.2). Esse e 
um diagrama com quatro por quatro campos, porque temos quatro variaveis no modelo, uma variavel 
dependente (C) e as variaveis explanatorias: renda pessoal disponivel (Yd), riqueza real (W) e taxa 
de juros real (I). 

Primeiro considere a diagonal principal, indo do canto esquerdo superior para o canto direito in¬ 
ferior. Nao ha pontos de dispersao nesses campos situados sobre a diagonal principal. Se houvesse, 
teriam um coeficiente de correlaqao igual a 1, porque os pontos seriam de uma dada variavel contra 
ela mesma. Os campos fora da diagonal mostram intercorrela 5 oes entre as variaveis. Tomemos, por 
exemplo, o campo da riqueza (W). Ele mostra que a riqueza e a renda estao altamente correlacionadas 
(o coeficiente de correlapao entre as duas e 0,97), mas nao perfeitamente. Se fossem perfeitamente 
correlacionadas (isto e, se tivessem um coeficiente de correlapao de 1), nao teriamos sido capazes de 
estimar a regressao (10.6.6), porque teriamos uma relac^ao linear exata entre riqueza e renda. O dia¬ 
grama de dispersao mostra que a taxa de juros nao esta altamente correlacionada com as outras tres 
variaveis. 


FIGURA 10.4 

Diagrama de 
dispersao para os 
dados do Exemplo 
10 . 2 . 



26 Veja KLEINBAUM, David G.; KUPPER, Lawrence L.; MULLER, Keith E. Applied regression analysis and other 
multivariate methods. 2. Ed. Boston, Mass.: PWS-Kent, 1988. p. 210. 
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Uma vez que a I'uncao do diagrama de dispersao agora e inclufda em varios programas de estatfs- 
tica, esse diagnostico deveria ser considerado com os discutidos anteriormente. Mas lembre-se de que 
correlates simples entre pares de variaveis podem nao ser um indicador definitive de colinearidade, 
como indicado anteriormente. 

Para concluirmos nossa discussao sobre como detectar a multicolinearidade, ressaltamos que os 
varios metodos que discutimos tem essencialmente uma natureza de “pescarias”, pois nao podem 
dizer qual desses metodos funcionara em determinada aplica£ao. Alias, nao se pode fazer muito a 
respeito, pois a multicolinearidade e especifica a determinada amostra sobre a qual o pesquisador 
pode nao ter muito controle, principalmente se os dados forem de natureza nao experimental — que 
e a sina dos pesquisadores no campo das ciencias sociais. 

Novamente, como parodia da multicolinearidade, Goldberger cita inumeras formas de detectar a 
micronumerosidade, como desenvolver valores crfticos do tamanho da amostra, n *, de tal modo que 
a micronumerosidade so sera um problema se o tamanho real da amostra, n, for menor que n*. A 
parodia de Goldberger tem o objetivo de enfatizar que amostras pequenas e a falta de variabilidade 
nas variaveis explanatorias podem causar problemas que sao, pelo menos, tao serios quanto aqueles 
devidos a multicolinearidade. 


10.8 Medidas corretivas 

O que podemos fazer se a multicolinearidade for grave? Temos duas op 9 oes: (1) nao fazer nada; 
ou (2) seguir alguns procedimentos. 

Nao fazer nada 

A escola do “deixa pra la” e expressa por Blanchard, como se segue: 27 

Quando estudantes calculam sua primeira regressao dos mmimos quadrados ordinarios (MQO), em geral 
o primeiro problema que encontram e o da multicolinearidade. Muitos deles concluem que ha algo erra- 
do no MQO; alguns recorrem a tecnicas novas e frequentemente criativas de resolver o problema. Mas, 
dizemos a eles, isso e um erro. A multicolinearidade e da vontade divina (algo foge ao nosso controle) e 
nao um problema com os MQO ou com uma tecnica estatfstica de modo geral. 

O que Blanchard esta dizendo e que a multicolinearidade e essencialmente um problema de defi- 
ciencia de dados (de novo, a micronumerosidade) e as vezes nao temos escolha sobre os dados dis- 
ponfveis para analise empfrica. 

Tambem nao podemos dizer que todos os coeficientes em um modelo de regressao sejam estatis- 
ticamente insignificantes. Alem disso, mesmo que nao possamos estimar um ou mais coeficientes de 
regressao com maior precisao, uma combina§ao linear deles (funcao estimavel) pode ser estimada 
com relativa eficiencia. Como vimos na Equagao (10.2.3), e possivel estimar a de modo unico, mes¬ 
mo que nao estimemos seus dois componentes individualmente. As vezes e o melhor que podemos 
fazer com um dado conjunto de dados. 28 

Procedimentos 

Podemos tentar seguir as regras praticas para resolver o problema da multicolinearidade; o suces- 
so dependera da gravidade do problema de colinearidade. 

1 . Uma informa^ao a priori. Suponha que o modelo 

Yi = Pi + foX 2l + PiXn + m , 


27 BLANCHARD, O. J. "Comment." Journal of Business and Economics Statistics, v. 5, p. 449-451, 1967. 

28 Para uma discussao interessante sobre isso, veja CONISK, J. "When collinearity is desirable." Western Economic 
Journal, v. 9, p. 393-407, 1971. 
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esteja sendo considerado, em que Y — consumo, X 2 — renda e X 2 — riqueza. Como observado anterior- 
mente, as variaveis de renda e riqueza tendem a ser altamente colineares. Mas suponha a priori que 
acreditemos que /S 3 = 0,1 ()ft 2 ; isto e, a taxa de variagao do consumo com relagao a riqueza e de um 
decimo da taxa correspondente com respeito a renda. Podemos, entao, efetuar a seguinte regressao: 

Yi= P\+ P 2 X 2 i + 0,10 fcXn + Ui 

= Pi + PiXi + Ut 

em que X t — X 2l + 0,1 X 2j . Apos obtermos fi 2 , podemos estimar fi 2 da relagao postulada entre fi 2 e 
Como obtemos uma informagao a priori'? Ela poderia vir de trabalho empfrico feito anteriormen- 
te, em que o problema da colinearidade e menos grave, ou da teoria relevante de nossa area de estudo. 
Por exemplo, na fungao de produgao do tipo Cobb-Douglas (7.9.1), se esperarmos retornos constan- 
tes de escala, entao (f> 2 + fi 2 ) = 1, e nesse caso poderfamos efetuar a regressao (8.6.14), fazendo a 
regressao da razao produgao-trabalho contra a razao capital-trabalho. Se houver colinearidade entre 
trabalho e capital, como em geral e o caso na maioria dos dados de amostra, tal transformagao pode 
reduzir ou eliminar o problema de colinearidade. Mas cabe uma advertencia a respeito de impor essas 
restrigoes a priori: “[...] uma vez que em geral desejaremos testar as previsoes a priori da teoria eco¬ 
nomica e nao apenas as impor a dados para os quais podem nao ser verdadeiras”. 29 Entretanto, sabe- 
mos da Segao 8.6 como testar a validade de tais restrigoes explicitamente. 

2. Combinando dados de corte transversal e de series temporais. Uma variante da tecnica de in- 
formagoes extemas ou a priori e a combinacdo de dados. Suponha que desejemos estudar a demanda por 
automoveis nos Estados Unidos e pressupomos que tenhamos dados de uma serie temporal do numero de 
carros vendidos, do prego medio do carro e da renda do consumidor. Suponha tambem que 

In Y, - + p 2 In Pt + ft In/?, + u t 

em que Y — numero de carros vendidos, P — prego medio, R — renda e t = tempo. Nosso objetivo e 
estimar a elasticidade prego, /3 2 , e a elasticidade renda, ft 2 . 

Em series temporais, as variaveis prego e renda em geral tendem a ser altamente colineares. Se 
efetuarmos a regressao anterior, enfrentaremos o problema usual da multicolinearidade. Uma forma 
de evitarmos isso tem sido sugerida por Tobin. 30 Ele diz que, se temos dados de corte transversal (por 
exemplo, dados gerados por pesquisa de consumo ou por estudos de orgamentos familiares conduzi- 
dos por instituigoes privadas ou publicas), podemos chegar a uma estimativa bastante confiavel da 
elasticidade renda /3 3 , porque nesses dados, coletados em um ponto no tempo, os pregos nao variam 
muito. Seja a elasticidade renda estimada por corte transversal. Usando essa estimativa, podemos 
escrever a regressao de serie temporal anterior como 

Y t = P\ + P 2 In Pt + u t 

em que Y* = In Y — /J 3 In R, isto e, Y * representa o valor de Y depois de removermos o efeito renda. 
Agora podemos obter uma estimativa da elasticidade prego ft 2 por meio da regressao anterior. 

Embora seja uma tecnica interessante, a combinagao de dados de series temporais e de corte trans¬ 
versal que acabamos de sugerir pode criar problemas de interpretagao, porque estamos supondo impli- 
citamente que a elasticidade renda estimada por corte transversal seja a mesma que a obtida de uma 
analise de serie temporal pura. 31 Nao obstante, a tecnica tem sido usada em varias aplicagoes e merece 
ser considerada em situagoes em que as estimativas por corte transversal nao variem substancialmente 
de um corte transversal para outro. Um exemplo dessa tecnica e fornecido no Exercicio 10.26. 


29 STEWART, Mark B.; WALLIS, Kenneth F. Introductory econometrics. 2. Ed. Nova York: John Wiley & Sons, A 
Halstead Press Book, 1981. p. 154. 

30 TOBIN, J. "A statistical demand function for food in the USA." journal of the Royal Statistical Society, Ser. A, 1950. 
p. 113-114. 

31 Para uma discussao completa e aplicagao da tecnica da combinagao, veja KUH, Edwin. Capital stock growth: a 
micro-econometric approach. Amsterda: North-Holland Publishing Company, 1963. cap. 5 e 6. 
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3. Exclusao de variavel(is) e vies de espccificagao. Quando nos deparamos com uma multicoli¬ 
nearidade grave, uma das coisas mais “simples” a fazer e excluir uma das variaveis colineares. Assim, 
em nossa ilustragao de consumo-renda-riqueza, quando excluimos a variavel riqueza, obtemos a re¬ 
gressao (10.6.4), que mostra que, enquanto no modelo original a variavel renda era estatisticamente 
insignificante, ela agora e “altamente” significativa. 

Mas, ao excluirmos uma variavel do modelo, podemos cometer um vies de especificagao ou erro 
de especificagao. Este surge de uma especificagao incorreta do modelo usado na analise. Se a teoria 
economica informa que a renda e a riqueza deveriam, ambas, ser incluidas no modelo que explica 
gastos de consumo, excluir a variavel riqueza constituiria vies de especificagao. 

Discutiremos o assunto no Capitulo 13, mas ja tratamos rapidamente dele na Segao 7.7. Se, por 
exemplo, o verdadeiro modelo e 

Y, = Pi + fcXii + foX-a + Uj 
mas ajustamos equivocadamente o modelo 

Y t = b x + b 12 X 2i + u, (10.8.1) 

pode-se mostrar que (veja o Apendice 13A.1) 

E(b\2 ) = Pi + fobi2 ( 10 . 8 . 2 ) 

em que b 22 = coeficiente angular na regressao de X 3 contra X 2 . Portanto, 6 obvio, da Equagao (10.8.2), 
que b l2 sera uma estimativa viesada de f J > 2 enquanto b 32 for diferente de zero (supoe-se que (f 2 seja 
diferente de zero; caso contrario nao ha sentido em incluir X 2 no modelo original ). 32 Evidentemente, 
se £>32 for zero, nao teremos problema de multicolinearidade. Tambem fica claro, da Equagao (10.8.2), 
que se £> 32 e / 1 3 forem positivos (ou ambos forem negativos), E(b l2 ) sera maior que (i 2 , daf, em media, 
b\ 2 superestimara /i 2 , provocando um vies positivo. De modo semelhante, se o produto b 32 /S 3 for 
negativo, em media £> 12 subestimara /3 2 , causando um vies negativo. 

Da discussao anterior fica claro que excluir uma variavel do modelo para atenuar o problema de 
multicolinearidade pode levar ao vies de especificagao. Logo, em algumas situagoes o remedio pode 
ser pior que a doenga, porque, enquanto a multicolinearidade pode impedir a estimagao exata dos 
parametros do modelo, omitir uma variavel pode causar serios equfvocos quanto aos verdadeiros 
valores dos parametros. Lembre-se de que os estimadores de MQO sao MELNT apesar da quase 
colinearidade. 

4. Transformagao de variaveis. Suponha uma serie temporal sobre gastos de consumo, renda e 
riqueza. Uma razao para a alta multicolinearidade entre renda e riqueza em tais dados e que com o 
tempo ambas as variaveis tendem a mover-se na mesma diregao. Uma forma de minimizar essa de- 
pendencia e proceder da maneira a seguir. 

Se a relagao 

Y,= P i + P 2 X 2I + yS 3 A 3 , + u, (10.8.3) 

for valida no tempo t, ela tambem o sera no tempo t — 1 , porque a origem do tempo e arbitraria de 
qualquer maneira. Portanto, temos 

Yt- i = P\+ PiX2,t-\ + faXu -1 + Ui -1 (10.8.4) 

Se subtrairmos a Equagao (10.8.4) da Equagao (10.8.3), obtemos 

Y t ~Yt -1 = HXit - X 2 ,,-x) + fo(X 3t - + v t (10.8.5) 

em que v ; = it, - u,_ A . A Equagao (10.8.5)6 conhecida como forma de primeira diferenga, porque nao 
efetuamos a regressao com as variaveis originais, mas com as diferengas de valores sucessivos das 
variaveis. 


32 Note, ainda, que se b 32 nao se aproxima de zero quando o tamanho da amostra esta aumentando indefinida- 
mente, entao fa, 2 ser a nao so tendencioso, mas inconsistente. 
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A regressao de primeira diferer^a frequentemente reduz a gravidade da multicolinearidade, por- 
que, embora os nfveis de X 2 e X 3 possam ser altamente correlacionados, nao ha, a priori, razao para 
acreditar que suas diferencas tambem estarao altamente correlacionadas. 

Como veremos nos capftulos sobre econometria de series temporais, uma vantagem secundaria 
da transformacao de primeira diferenfa e que ela pode tornar estacionaria uma serie temporal nao es¬ 
tacionaria. Nesses capftulos veremos a importancia de series temporais estacionarias. Como observado 
no Capitulo 1, falando em termos nao exatos, uma serie temporal, por exemplo, Y t , e estacionaria se sua 
media e sua variancia nao mudam sistematicamente ao longo do tempo. 

Outra transformacao muito usada na pratica e a transformacao proporcional. Considere o modelo: 

Y t = ft + PiX 2t + ftX 3 , + u t (10.8.6) 

em que Yea despesa de consumo em S, X 2 e o PIB e X 3 e a populacao total. Uma vez que o PIB e a 
populacao crescem ao longo do tempo, e provavel que estejam correlacionados. Uma “solu£ao” para 
esse problema e expressar o modelo em base per capita, isto e, dividindo a Equa§ao (10.8.4) por X 3 , 
para obter: 


X 2l 



+ ft + 



(10.8.7) 


Essa transformacao pode reduzir a colinearidade nas variaveis originais. 

Mas a transformacao de primeira diferenca ou a proporcional nao estao isentas de problemas. Por 
exemplo, o termo de erro v t na Equacao (10.8.5) pode nao satisfazer uma das hipoteses do modelo 
classico de regressao linear, a de que nao ha correlacao serial entre os termos de erro. Como veremos 
no Capitulo 12, se o termo de erro original u, nao registrar correlacao serial, o termo de erro vt obtido 
anteriormente nao estara correlacionado serialmente na maioria dos casos. Portanto, o remedio pode 
ser pior que a doenga. Alem disso, ha perda de uma observacao devido ao procedimento de tomar a 
diferen^a, e, portanto, os graus de liberdade sao reduzidos em uma unidade. Em uma amostra peque- 
na, este poderia ser um fator que se desejaria pelo menos levar em consideragao. Alem disso, o pro¬ 
cedimento de primeira diferenga pode nao ser adequado a dados de corte transversal, ja que nao ha 
um ordenamento logico das observances. 

De modo semelhante, no modelo proporcional (10.8.7), o termo de erro 

u t 

X* 


sera heterocedastico se o termo de erro original u, for homocedastico, como veremos no Capitulo 11. 
Novamente, o remedio pode piorar a docnca (a colinearidade). 

Em resumo, deve-se ter cautela em usar o metodo da primeira difcrcnca ou da transformacao 
proporcional para resolver o problema da multicolinearidade. 


5. Dados adicionais ou novos. Como a multicolinearidade e um aspecto da amostra, e possfvel 
que, em outra amostra envolvendo as mesmas variaveis, a colinearidade possa nao ser tao grave 
quanto na primeira. As vezes aumentar o tamanho da amostra (se possfvel) pode atenuar o problema 
da colinearidade. Por exemplo, no modelo de tres variaveis vimos que 

i r ~ 

var (ft) 


a 


E40 - r h) 


Agora, quando a amostra aumenta, x h em geral aumentara. (Por que?) Portanto, para qualquer 
r 2 3 dado, a variancia de ft diminuira, diminuindo assim o erro padrao, o que nos permitira estimar ft 
com mais precisao. 

Como ilustracao, considere a seguinte regressao de gastos de consumo Y contra renda X 2 e rique- 
za X 3 , com base em 10 observapoes : 33 


33 


Agradego ao falecido Albert Zucker porfornecer os resultados dados nas regressoes a seguir. 
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Yi = 24,377 + 0,8716X2/ - 0,0349X 3 * 
t= (3,875) (2,7726) (- 1,1595) R 2 = 0,9682 


( 10 . 8 . 8 ) 


O coeficiente de riqueza nessa regressao nao so tem o sinal errado, mas e estatisticamente 
insignificante ao nlvel de 5%. Quando o tamanho da amostra aumentou para 40 observances (micro- 
numerosidade?), os seguintes resultados foram obtidos: 


% = 2,0907 + Q,1299X 2 , + 0,0605X 3i 
t= (0,8713) (6,0014) (2,0014) R 2 = 0,9672 


Agora, o coeficiente de riqueza nao so tem o sinal correto, mas e estatisticamente significativo ao 
nivel de 5%. 

Nem sempre e facil obter dados adicionais ou “melhores”, pois, como observam Judge et al.: 


Infelizmente, os economistas raramente podem obter dados adicionais sem arcar com altos custos, muito 
menos podem escolher os valores das variaveis explanatorias que desejam. Alem disso, ao acrescentarmos 
novas variaveis em situagoes nao controladas, devemos ter ciencia de que estamos adicionando observa- 
goes geradas por um processo que nao aquele associado aos dados originais; isto e, devemos ter certeza de 
que a estrutura economica associada as novas observagoes e a mesma que a original . 34 


6. Reduzindo a colinearidade em regressoes polinomiais. Na Segao 7.10 discutimos modelos 
de regressao polinomial. Um aspecto especial desses modelos e que a variavel explanatoria aparece 
com varios expoentes. Na funpao cubica de custo total envolvendo a regressao do custo total contra 
a produgao, a produgao ao quadrado e a produgao ao cubo, como na Equagao (7.10.4), os varios ter- 
mos de produgao serao correlacionados, dificultando a estimagao precisa dos varios coeficientes an- 
gulares. 35 No entanto, na pratica tem-se verificado que, se a(s) variavel(is) explanatoria(s) sao 
expressas na forma de desvios (desvios em relagao a media), a midticolinearidade reduz-se substan- 
cialmente. Mesmo assim o problema pode persistir, 36 caso em que se pode querer considerar tecnicas 
como os polinomios ortogonais . 37 

7. Outros metodos de remediar a multicolinearidade. Tecnicas estatisticas multivariadas como 
a analise de fator e componentes principals ou tecnicas como a regressao ridge sao empregadas 
com frequencia para “resolver” o problema da multicolinaridade. Infelizmente, estao alem do escopo 
deste livro, pois nao podem ser discutidas com competencia sem recorrermos a algebra matricial. 38 


10.9 A multicolinearidade e um mal necessario? 

Talvez nao, se o objetivo for apenas a previsao 


Ja foi dito que, se o unico proposito da analise de regressao for a previsao ou o prognostico, a mul¬ 
ticolinearidade nao e um problema grave, porque, quanto mais alto for o R 2 , melhor a previsao. 39 Mas 
isso pode acontecer “[...] enquanto os valores das variaveis explanatorias para as quais se deseja fazer 
as previsoes obedecerem as mesmas dependencias lineares quase exatas que a matriz projetada X 


34 JUDGE et al., op. cit., p. 625. Veja tambem a Segao 10.9. 

35 Como observado, uma vez que a relagao entre X, X 2 e X 3 e nao linear, as regressoes polinomiais nao violam a 
hipotese de ausencia de multicolinearidade do modelo classico, falando em termos estritos. 

36 Veja BRADLEY, R. A.; SRIVASTAVA, S. S. "Correlation and polynomial regression." American Statistician, v. 33, 
p. 11-14, 1979. 

37 Veja DRAPER, Norman; SMITH, Harry. Applied regression analysis. 2. Ed. Nova York: John Wiley & Sons, 1981. 
p. 266-274. 

38 Essas tecnicas sao abordadas de um ponto de vista aplicado em CHATTERJEE, Samprit; PRICE, Bertram. Regression 
analysis by example. Nova York: John Wiley & Sons, 1 977. Cap. 7 e 8. Veja tambem VINOD, H. D. "A survey of 
ridge regression and related techniques for improvements over ordinary least squares." Review of Economics and 
Statistics, v. 60, p. 121-131, fev. 1978. 

39 Veja CEARY, R. C. "Some results about relations between stochastic variables: a discussion document." Review 
of International Statistical Institute, v. 31, p. 163-181, 1963. 
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[de dados] original”. 40 Assim, se em uma regressao estimada descobrir-se que X 2 = 2X 2 aproximada- 
mente, entao em uma amostra futura usada para prever Y, X 2 tambem devera ser aproximadamente 
igual a 2 X 3 , uma condigao diffcil de atender na pratica (veja a nota de rodape 35), caso em que a pre- 
visao se tomara cada vez mais incerta . 41 Alem disso, se o objetivo da analise nao for apenas a previsao, 
mas tambem a estimagao confiavel dos parametros, uma multicolinearidade acentuada sera um proble- 
ma, porque vimos que isso leva a erros padrao maiores dos estimadores. 

Em uma situagao, no entanto, a multicolinearidade pode nao impor um problema grave. E o caso 
quando R 2 for alto e os coeficientes de regressao individualmente significativos, como revelado pelos 
valores 1 mais altos. No entanto, os diagnostics de multicolinearidade, por exemplo, o indice condi- 
cional, indicam que ha grave colinearidade nos dados. Quando essa situagao pode surgir? Como obser- 
va Johnston: 

Isto pode ocorrer se os coeficientes individuals forem numericamente bem superiores ao verdadei- 
ro valor, de modo que o efeito ainda aparecera, apesar dos erros padrao inflados e/ou porque o verda- 
deiro valor em si e tao grande que mesmo uma estimativa para baixo ainda se mostra significativa 42 


10.10 Um exemplo ampliado: os dados de Longley 


Conclulmos este capftulo analisando os dados coletados por Longley . 43 Embora coletados origi- 
nalmente para avaliar a exatidao computacional das estimativas dos minimos quadrados em varios 
programas de computador, os dados de Longley tornaram-se o instrumento para ilustrar varios pro- 
blemas econometrics, inclusive a multicolinearidade. Os dados sao reproduzidos na Tabela 10.8. 
Eles sao series temporais para os anos de 1947-1962 e referem-se a Y — numero de pessoas empre- 
gadas, em milhares; X\ — deflator implicito dos pregos no PNB; X 2 = PNB, em milhoes de $; 
X 2 — numero de pessoas desempregadas, em milhares; X 4 — numero de pessoas nas forgas armadas; 
X 5 = populagao nao institucionalizada com mais de 14 anos de idade; e X () = ano, igual a 1 em 1947, 
2 em 1948 e 16 em 1962. 


TABELA 10.8 

Observagao 

Y 

*i 

*2 

*3 

*4 

*5 

Tempo 

Dados de Longley 

1947 

60.323 

830 

234.289 

2.356 

1.590 

107.608 

1 

Fonte: LONGLEY, J. “An 

1948 

61.122 

885 

259.426 

2.235 

1.456 

108.632 

2 

appraisal of least-square 

1949 

60.171 

882 

258.054 

3.682 

1.616 

109.773 

3 

programs from the point of 
user.” Journal of the 

1950 

61.187 

895 

284.599 

3.351 

1.650 

110.929 

4 

American Statistical 

1951 

63.221 

962 

328.975 

2.099 

3.099 

112.075 

5 

Association, v. 62, p. 

1952 

63.639 

981 

346.999 

1.932 

3.594 

113.270 

6 

819-841,1967 

1953 

64.989 

990 

365.385 

1.870 

3.547 

115.094 

7 


1954 

63.761 

1.000 

363.112 

3.578 

3.350 

116.219 

8 

1955 

66.019 

1.012 

397.469 

2.904 

3.048 

117.388 

9 

1956 

67.857 

1.046 

419.180 

2.822 

2.857 

118.734 

10 

1957 

68.169 

1.084 

442.769 

2.936 

2.798 

120.445 

11 

1958 

66.513 

1.108 

444.546 

4.681 

2.637 

121.950 

12 

1959 

68.655 

1.126 

482.704 

3.813 

2.552 

123.366 

13 

1960 

69.564 

1.142 

502.601 

3.931 

2.514 

125.368 

14 

1961 

69.331 

1.157 

518.173 

4.806 

2.572 

127.852 

15 

1962 

70.551 

1.169 

554.894 

4.007 

2.827 

130.081 

16 


40 JUDGE et al., op. cit., p. 619. Nesta pagina, o leitor tambem encontrara a demonstragao de por que, apesar da 
colinearidade, pode-se obter melhores previsoes medias se a estrutura de colinearidade existente tambem 
continuar nas amostras futuras. 

41 Para uma excelente discussao, veja MALINVAUD, E. Statistical methods of econometrics. 2. ed. Amsterda: North- 
-Holland Publishing Company, 1970. p. 220-221. 

42 JOHNSTON, J. Econometric methods. 3. ed. Nova York: McGraw-Hill, 1984. p. 249. 

43 LONGLEY, J. "An appraisal of least-squares programs from the point of the user." journal of the American Statistical 
Association, 1967. v. 62, p. 819-841. 
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Suponha que nosso objetivo seja prever Y com base nas seis variaveis X. Usando EViews 6 , obte- 
mos os seguintes resultados de regressao: 

Dependent Variable: Y 
Sample: 1947-1962 


Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

-3482259. 

890420.4 

-3.910803 

0.0036 

Xi 

15.06187 

84.91493 

0.177376 

0.8631 

X 2 

-0.035819 

0.033491 

-1.069516 

0.3127 

X 3 

-2.020230 

0.488400 

-4.136427 

0.0025 

x 4 

-1.033227 

0.214274 

-4.821985 

0.0009 

X 5 

-0.051104 

0.226073 

-0.226051 

0.8262 

X 6 

1829.151 

455.4785 

4.015890 

0.0030 

R-squared 

0. 

995479 Mean 

dependent var. 

65317.00 


Adjusted R-squared 0.992465 
S.E. of regression 304.8541 
Sum squared resid. 836424.1 
Log likelihood -109.6174 
Durbin-Watson stat. 2.559488 


S.D. dependent var. 3511.968 
Akaike info criterion 14.57718 
Schwarz criterion 14.91519 
F-statistic 330.2853 
Prob(F-statistic) 0.000000 


Um exame rapido desses resultados sugeriria que temos o problema de colinearidade, pois o valor 
de R 1 e muito alto, mas algumas poucas variaveis sao estatisticamente insignificantes (Aj, X 2 e Aj), 
um sintoma classico de multicolinearidade. Para melhor entendermos o assunto, mostramos na Tabe- 
la 10.9 as intercorrela 5 oes entre os seis regressores. 

Esta tabela fornece o que e chamado de matriz de correla^ao. As entradas na diagonal principal 
(aquelas que vao do canto esquerdo superior para o canto direito inferior) mostram a correlagao de 
uma variavel com ela mesma, o que e sempre 1 , por definifao, e as entradas fora da diagonal principal 
sao as correla 5 oes entre pares de variaveis X. Se voce tomar a primeira linha desta tabela, tera a cor- 
relagao de Xj com as outras variaveis X. Por exemplo, 0,991589 e acorrelaqao entre A"! e X 2 , 0,620633 
e a corrcla^ao entre Aj e Xj, e assim por diante. 

Como se pode ver, varias dessas correla£des sao muito altas, sugerindo que pode haver um 
problema grave de colinearidade. Obviamente, nao podemos esquecer a advertencia apresentada 
anteriormente de que essas correlaqoes entre pares de variaveis podem ser uma condi^ao suficien- 
te, mas nao necessaria, para a existencia de multicolinearidade. 

Para entendermos a natureza do problema da multicolinearidade, efetuemos as regressoes auxilia- 
res, que sao as regressao de cada variaveis X contra as variaveis X remanescentes. Para pouparmos 
espa£ 0 , apresentaremos apenas os valores de R 2 obtidos dessas regressoes, apresentados na Tabela 
10.10. Uma vez que os valores de R 2 dessas regressoes auxiliares sao muito altos (com a possivel 
exceqao da regressao de X 4 ) nas variaveis X remanescentes, parece que temos um grave problema de 
colinearidade. A mesma informagao e obtida dos fatores de tolerancia. Como notamos, quanto mais 
proximo o fator de tolerancia estiver de zero, maior sera a evidencia de colinearidade. 


TABELA 10.9 


Xi 

x 2 

x 3 

x 4 

x 5 

x 6 

Intercorrelajoes 

Xi 

1,000000 

0,991589 

0,620633 

0,464744 

0,979163 

0,991149 


x 2 

0,991589 

1,000000 

0,604261 

0,446437 

0,991090 

0,995273 


X 3 

0,620633 

0,604261 

1,000000 

-0,177421 

0,686552 

0,668257 


x 4 

0,464744 

0,446437 

-0,177421 

1,000000 

0,364416 

0,417245 


X 5 

0,979163 

0,991090 

0,686552 

0,364416 

1,000000 

0,993953 


x 6 

0,991149 

0,995273 

0,66825 7 

0,41 7245 

0,993953 

1,000000 
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TABELA 10.10 

Valores de R 2 das 
regressdes auxiliares 


Variavel dependente 

Valor de R 2 

Tolerancia (TOL) = 1 - R 2 

Xi 

0,9926 

0,0074 

x 2 

0,9994 

0,0006 

x 3 

0,9702 

0,0298 

x 4 

0,7213 

0,2787 

X 5 

0,9970 

0,0030 

x 6 

0,9986 

0,0014 


Aplicando a regra pratica de Klein, vemos que os valores de R 1 obtidos das regressoes auxiliares 
excedem o valor do R 2 geral (aquele obtido na regressao de Y contra todas as variaveis X ), 0,9954 em 
3 de 6 regressoes auxiliares, novamente sugerindo que de fato os dados de Longley sao afetados pelo 
problema da multicolinearidade. Por sinal, aplicando o teste F dado na Equa9ao (10.7.3), o leitor 
deveria verificar se os valores de R 2 dados nas tabelas precedentes sao todos significativamente dife- 
rentes de zero, do ponto de vista estatfstico. 

Observamos que os estimadores de MQO e seus erros padrao sao sensfveis a pequenas altera£6es 
nos dados. No Exercicio 10.32 o leitor e solicitado a refazer a regressao de Y contra todas as seis 
variaveis X, mas excluindo as ultimas observa9oes de dados, ou seja, efetuando a regressao para o 
periodo de 1947-1961. Voce vera como os resultados da regressao mudam ao excluir as observa9oes 
de apenas um ano. 

Agora que constatamos um problema de multicolinearidade, que a£oes “corretivas” podemos to- 
mar? Vamos reconsiderar nosso modelo original. Antes de mais nada, poderlamos expressar o PNB 
nao em termos nominais, mas em termos reais, o que podemos fazer dividindo o PNB nominal pelo 
deflator implicito dos pre90S. Em segundo lugar, uma vez que a populafao nao institucionalizada de 
mais de 14 anos aumenta ao longo do tempo devido ao crescimento populacional natural, ela estara 
altamente correlacionada com o tempo, a variavel X ( , de nosso modelo. Em vez de mantermos ambas 
as variaveis, manteremos a variavel X 5 e excluiremos X (y Em terceiro lugar, nao ha razao contundente 
para incluir V 3 , o numero de pessoas desempregadas; talvez a taxa de desemprego tivesse sido uma 
medida melhor das cond^oes do mercado de trabalho. Mas nao temos dados sobre elas. Logo, exclui¬ 
remos a variavel X 3 . Efetuando essas altera£6es, obtemos os seguintes resultados de regressao (PNBR = 
PNB real). 44 


Dependent Variable: Y 
Sample: 1947-1962 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

65720.37 

10624.81 

6.185558 

0.0000 

RGNP 

9.736496 

1.791552 

5.434671 

0.0002 

X 4 

-0.687966 

0.322238 

-2.134965 

0.0541 

*5 

-0.299537 

0.141761 

-2.112965 

0.0562 


.R-squared 

0.981404 

Mean dependent var. 

65317.00 

Adjusted R-squared 

0.976755 

S.D. dependent var. 

3511.968 

S.E. of regression 

535.4492 

Akaike info criterion 

15.61641 

Sum squared resid. 

3440470 . 

Schwarz criterion 

15.80955 

Log likelihood 

-120.9313 

F- statistic 

211.0972 

Durbin-Watson stat. 

1.654069 

Prob {F- statistic) 

0.000000 


44 O coeficiente de correlagao entre X 5 e X 6 e de aproximadamente 0,9939, uma correlagao realmente muito alta. 
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Embora o valor de R 1 2 3 4 5 6 tenha declinado ligeiramente em compara^ao ao R 2 original, ainda e muito 
alto. Agora, todos os coeficientes estimados sao significativos e os sinais dos coeficientes fazem sen- 
tido, do ponto de vista economico. 

Deixamos para o leitor a criaijao de modelos alternatives e ver como os resultados mudam. Lem- 
bre-se tambem da advertencia feita sobre o uso do metodo de transforma 9 ao proporcional dos dados 
para atenuar o problema da colinearidade. Retomaremos essa questao no Capftulo 11. 


Resumo e 
conclusoes 


1 . Uma das hipoteses do modelo classico de regressao linear e que nao ha multicolinearidade entre 
as variaveis explanatorias, os X. Interpretada em sentido amplo, a multicolinearidade refere-se a 
situa9ao em que ha uma rela^ao linear exata ou aproximadamente exata entre as variaveis X. 

2 . As consequencias da multicolinearidade sao as seguintes: se existe colinearidade perfeita entre os 
X, seus coeficientes de regressao sao indeterminados e seus erros padrao nao sao definidos; se a 
colinearidade for alta, mas nao perfeita, a estimaejao dos coeficientes de regressao sera possivel, 
mas seus erros padrao tendem a ser grandes. Como resultado, os valores populacionais dos coefi¬ 
cientes nao poderao ser estimados com precisao. Entretanto, se o objetivo for estimar combina- 
9oes lineares desses coeficientes, as fungoes estimaveis, pode-se fazer ate mesmo na presen9a de 
multicolinearidade perfeita. 

3 . Embora nao haja metodos seguros para detectar a colinearidade, ha varios indicadores: 

(a) O sinal mais claro de multicolinearidade e quando R 2 e muito alto, mas nenhum dos coefi¬ 
cientes de regressao e estatisticamente significativo com base no teste t convencional. Este e 
um caso extremo, evidentemente. 

( b ) Em modelos envolvendo apenas duas variaveis explanatorias, pode-se ter uma ideia boa da 
colinearidade examinando-se o coeficiente de correla9ao simples, ou de ordem zero, entre as 
duas variaveis. Se a correla9ao for alta, em geral esta e atribulda a multicolinearidade. 

(c) Entretanto, os coeficientes de correla9ao de ordem zero podem ser enganosos em modelos 
que envolvem mais de duas variaveis X, uma vez que e possivel ter correla9oes baixas de 
ordem zero e, no entanto, encontrar alta multicolinearidade. Em situa9oes como essas, pode 
ser preciso examinar os coeficientes de correla9ao parcial. 

( d) Se R 2 e alto, mas as correla9oes parciais sao baixas, a multicolinearidade e uma possibilida- 
de. Nesse caso, uma ou mais variaveis podem ser superfluas. Mas, se R 2 for alto e as corre- 
la9oes parciais tambem, a multicolinearidade pode nao ser detectavel imediatamente. Alem 
disso, como C. Robert Wichers, Krishna Kumar, John O’Hagan e Brendan McCabe ressalta- 
ram, ha alguns problemas estatfsticos com o teste de correla9ao parcial sugerido por Farrar e 
Glauber. 

(e) Portanto, pode-se efetuar a regressao de cada uma das variaveis X t contra as variaveis X rema- 
nescentes do modelo e descobrir os coeficientes de determina9ao correspondentes, R 2 ,. Um 
elevado R 2 , sugere que A, esta estreitamente correlacionado com o restante dos X. Assim, pode- 
mos excluir esse A, do modelo, contanto que ele nao leve a um grave vies de especifica9ao. 

4 . Detectar a multicolinearidade e meio caminho andado. A outra metade diz respeito a como se 
livrar do problema. Novamente, nao ha metodos seguros, apenas algumas regras: ( 1 ) usar infor- 
ma9oes extemas ou obtidas a priori ; ( 2 ) combinar dados de corte transversal com series tempo- 
rais; ( 3 ) omitir uma variavel altamente colinear; ( 4 ) transformar dados; e ( 5 ) obter dados 
adicionais ou novos. Obviamente, qual dessas regras funcionara na pratica dependera da natureza 
dos dados e da gravidade do problema de colinearidade. 

5 . Notamos o papel da multicolinearidade na previsao e ressaltamos que, se a estrutura de colineari¬ 
dade continual' na amostra futura, sera arriscado empregar, para fins de previsao, a regressao esti- 
mada afetada pela multicolinearidade. 

6 . Embora a multicolinearidade tenha recebido muita (alguns diriam excessiva) aten9ao na literatura 
especifica, um problema igualmente importante que ocorre na pesquisa empirica e a micronumerosi- 
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EXERCICIOS 


TABELA 10.11 


dade, o pequeno tamanho da amostra. De acordo com Goldberger, “ao ler um artigo de pesquisa 
que reclama da multicolinearidade, o leitor deveria ver se as reclamagoes seriam convincentes se 
o termo “multicolinearidade” fosse substitufdo por “micronumerosidade”. 45 Ele sugere que o 
leitor decida quanto o n, o numero de observa£6es, e pequeno antes de considerar que se trata de 
um problema de amostra pequena, e que verifique quanto o valor de R 2 e alto em uma regressao 
auxiliar antes de afirmar que o problema da colinearidade e muito grave. 


10.1. No modelo de regressao linear com k variaveis, ha k equa£oes normais para estimar as k incognitas. 
Essas equa£des normais sao dadas no Apendice C. Imagine que X k seja uma combinaijao linear 
perfeita das variaveis X restantes. Como poderfamos mostrar que nesse caso e impossfvel esti¬ 
mar os coeficientes de regressao k'l 


Y 

*2 

*3 

-10 

1 

1 

-8 

2 

3 

-6 

3 

5 

-4 

4 

7 

-2 

5 

9 

0 

6 

11 

2 

7 

13 

4 

8 

15 

6 

9 

17 

8 

10 

19 

10 

11 

21 


10.2 Considere o conjunto de dados hipoteticos na Tabela 10.11. Suponha que se queira ajustar o 
modelo 

Yi = P\ + P2X21 + PiXn + Uj 

aos dados. 

a. E possfvel estimar as tres incognitas? Por que? 

b. Em caso negativo, quais luncdes lineares desses parametros, as fun£oes estimaveis, voce 
pode estimar? Mostre os calculos necessarios. 

10.3 Retome o exemplo de mortalidade infantil discutido no Capitulo 8 (Exemplo 8.1). O exemplo 
envolvia a regressao da taxa de mortalidade infantil (CM) contra o PNB per capita (PNBpc) e 
a taxa de alfabetizapao feminina (FLR). Imagine, agora, que seja incluida a variavel taxa de 
fertilidade total (TFR) ao modelo. Isto da os seguintes resultados de regressao: 


Dependent Variable: CM 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

168.3067 

32.89165 

5.117003 

0.0000 

PGNP 

-0.005511 

0.001878 

-2.934275 

0.0047 

FLR 

-1.768029 

0.248017 

-7.128663 

0.0000 

TFR 

12.86864 

4.190533 

3.070883 

0.0032 


R-squared 

0.747372 

Mean dependent var. 

141.5000 

Adjusted R-squared 

0.734740 

S.D. dependent var. 

75.97807 

S.E. of regression 

39.13127 

Akaike info criterion 

10.23218 

Sum squared resid. 

91875.38 

Schwarz criterion 

10.36711 

Log likelihood 

-323.4298 

E-statistic 

59.16767 

Durbin-Watson stat. 

2.170318 

Prob(E-statistic) 

0.000000 


45 


GOLDBERGER, op. cit., p. 250. 
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a. Compare esses resultados com os da Equa£ao (8.1.4). Que mudancas voce ve? E como as 
explica? 

b. Vale a pena adicionar a variavel TFR ao modelo? Por que? 

c. Uma vez que todos os coeficientes individuais t sao estatisticamente significativos, pode- 
mos dizer que nao temos um problema de colinearidade neste caso? 

10.4. Se a relafao X\X\j + 7 . 2 X 2 , + 7 . 3 X 3 ,- = 0 for verdadeira para todos os valores de A.j, X 2 e ft, 
estime r 12 > 3 , r 132 e r 2 34 . Obtenha, tambem, R\ 23 , R\ 13 e R\\ 2 . Qual o grau de multicolinea¬ 
ridade nesta situaftio? Nota: R\ 22 e o coeficiente de dctcrminapao na regressao de Y contra 
X 2 e ft. Outros valores de Rr devem ser interpretados de modo semelhante. 

10.5. Considere o seguinte modelo: 

Y t = fi\ + ft X t + ftX,_i + ($ 4 X 1-2 + ftX ? _ 3 + P(,X t -4 + u, 

ern que Y = consumo, X = renda e t = tempo. O modelo anterior postula que a despesa de 
consumo no tempo t e uma fun 5 ao nao so da renda no tempo t, mas tambem da renda atra- 
ves dos perfodos anteriores. Assim, a despesa de consumo no primeiro trimestre de 2000 e 
uma funcao da renda naquele trimestre e no quarto trimestre de 1999. Tais modelos sao 
chamados de modelos com defasagens distribuidas e serao examinados em um dos pro- 
ximos capitulos. 

a. Voce esperaria multicolinearidade em tais modelos e por que? 

b. Se a colinearidade e esperada, como voce resolveria o problema? 

10.6. Considere o exemplo da Se<;ao 10.6 (Exemplo 10.1). Como conciliaria a diferenga na pro- 
pensao marginal ao consumo obtida das Equa 5 oes (10.6.1) e (10.6.4)? 

10.7. Nos dados envolvendo series temporais economicas como PNB, oferta de moeda, precis, 
renda, desemprego etc., em geral suspeita-se de multicolinearidade. Por que? 

10.8. Suponha o modelo 

Y, = + P 2 X 2 ,■ + P 2 X 2 j + Uj 

em que r 2 j, o coeficiente de correla 9 ao entre X 2 e X 3 , seja zero. Portanto, alguem sugere que 
voce fa$a as seguintes regressoes: 

Yi = O!) + 0.2X21 + U\i 

Yi = yi + 73X3, + u 2 i 

a. a 2 — P 2 e y 3 — /S 3 ? Por que? 

b. (> 2 sera igual a H] ou a y t ou a alguma combinayao deles? 

c. A var (fi 2 ) — var (a 2 ) e a var (ft) = var (y 3 )? 

10.9. Retome o exemplo do Capitulo 7 em que ajustamos a liingao de produgao Cobb-Douglas ao 
setor de manufatura de todos os 50 Estados e o Distrito de Columbia para 2005. Os resulta¬ 
dos da regressao da F.quapao (7.9.4) mostram que tanto os coeficientes do trabalho quanto do 
capital sao, individualmente, significativos do ponto de vista estatistico. 

a. Descubra se as variaveis do trabalho e do capital estao altamente correlacionadas. 

b. Se a sua resposta a (a) for afirmativa, voce excluiria a variavel trabalho, do modelo e faria 
a regressao da variavel produ 5 ao apenas contra a variavel capital? 

c. Se voce fizer isso, que tipo de vies de especificaqiao sera cometido? Descubra a natureza 
desse vies. 

10.10. Retome o Exemplo 7.4. Para este problema, a matriz de correlacjao e a seguinte: 

Xi X* X* 

Xi 1 0,9742 0,9284 

Xf 1,0 0,9872 

1.0 
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a. “Uma vez que as correlagoes de ordem zero sao muito altas, deve haver multicolinearidade 
grave.” Comente. 

b. Voce excluiria as variaveis X 2 e X] do modelo? 

c. Se as excluir, o que acontecera com o valor do coeficiente de Xf! 

10.11. Regressao por etapas {stepwise). Ao decidir qual e o “melhor” conjunto de variaveis explana- 
torias para um modelo de regressao, os pesquisadores seguem frequentemente o metodo de 
regressao por etapas. Nesse modelo, as variaveis X sao introduzidas uma por vez {stepwise 
forward regression) ou todas as variaveis X posslveis sao inclufdas em uma regressao multipla 
e, em seguida, rejeitadas uma a uma {stepwise backward regression). A decisao de acrescentar 
ou excluir uma variavel em geral e tomada com base na contribuigao daquela variavel a soma 
dos quadrados explicados, de acordo com o teste F. De acordo com seus conhecimentos sobre 
multicolinearidade, voce recomendaria esse procedimento? Justifique sua resposta. 

10.12. Informe, justificando, se as seguintes afirmagdes sao verdadeiras, falsas ou incertas: 

a. Apesar da multicolinearidade perfeita, os estimadores de MQO sao os melhores estima- 
dores lineares nao viesados. 

b. Em casos de alta multicolinearidade, nao e possivel avaliar o significado individual de 
um ou mais coeficientes parciais de regressao. 

c. Se uma regressao auxiliar mostra que determinado Wye alto, ha evidencias incontestaveis 
de elevada colinearidade. 

d. As altas correlagoes de pares de variaveis nao sugere que haja multicolinearidade. 

e. A multicolinearidade e inofensiva se o objetivo da analise for apenas de previsao. 

f. Ceteris paribus, quanto mais alto for o FIV, maior a variancia dos estimadores de MQO. 

g. A tolerancia (TOL) e uma medida melhor de multicolinearidade que o FIV. 

h. Nao obteremos um valor alto de R 2 em uma regressao multipla se todos os coeficientes 
angulares parciais forem individualmente insignificantes, do ponto de vista estatistico, 
com base no teste 1 usual. 

i. Na regressao de Y contra X 2 e X 3 , suponha que haja pouca variabilidade nos valores de X 2 . Isso 
aumentaria a var iff. No extremo, se todos os X 2 forem identicos, a var ((f) sera infinita. 

10.13 a. Mostre que se r u — 0 para todo i = 2, 3, . . ., k entao 

^1,23 ...k — 0 

b. Qual a importancia desse achado para a regressao da variavel X 1 {— Y) contra X 2 , X 2 ,...., Xf! 
10.14. Suponha que todos os coeficientes de correlagao de ordem zero de Xf — Y), X 2 ,...., X k sejam 
iguais a r. 

a. Qual o valor de R 2 2 3 f! 

b. Quais os valores dos coeficientes de correlagao de primeira ordem? 

** 10.15. Na notagao matricial pode-se mostrar (veja o Apendice C) que 

P = (X'X)-'X'y 

a. O que acontece com f quando ha colinearidade perfeita entre os X ? 

b. Como podemos saber se existe colinearidade perfeita? 

** 10.16. Usando a notagao matricial, podemos mostrar 

var-cov (p) = er 2 (X'X)~ 1 


O que acontece a essa matriz var-cov: 

a. Quando ha multicolinearidade perfeita? 

b. Quando a colinearidade e alta, mas nao perfeita? 


* Verifique se seu raciocfnio esta de acordo com o de GOLDBERGER, Arthur S.; JOCHEMS, D. B. "Note on 
stepwise least-squares." journal of the American Statistical Association, mar. 1961. v. 56, p. 105-110. 

** _ 

Opcional. 
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10.17. Considere a seguinte matriz de correla^ao: 



X 2 

X, 3 ••• 

Xk 

X2 

1 

7*2 3 •*• 

rik 

R= X 3 

T32 

1 ••• 

r 2 k 

x k 

-m 

r k3 ■■■ 

1 _ 


Com base nessa matriz, como voce verificaria se: (a) ha colinearidade perfeita; ( b ) ha colinea- 
ridade menos que perfeita; e (c) os X nao sao correlacionados. 

Dica : Pode-se usar |R| para responder a essas questoes, em que |R| denota o determinante de R. 

10.18. Variaveis explanatorias ortogonais. Suponha no modelo 

Yi = + PiXu + P3X3 i + • • • + p k X u + Ui 

que X 2 a X k sejam todos nao correlacionados. Tais variaveis sao chamadas variaveis ortogo¬ 
nais. Se esse for o caso: 

a. Qual a estrutura da matriz (X'X)? 

b. Como poderfamos obter = (X'X) _1 X'y? 

c. Qual a natureza da matriz de variancia-covariancia de /}? 

d. Suponha que voce tenha efetuado a regressao e depois queira introduzir outra variavel 
ortogonal, por exemplo, X k+x no modelo. Voce tem de recalcular todos os coeficientes 
anteriores de /i, a Por que? 

10.19. Considere o modelo a seguir: 

PNB r = f5\ + @ 2 1 + /^(M t ~ + Ut 


em que PNB, = PNB no perfodo t, M f = oferta de moeda no perfodo t, M,_, = oferta de 
moeda no perfodo (t — 1) e (M, — M,_,) = variayao na oferta de moeda entre os perfodos t e 
(t — 1). Este modelo postula que o nfvel de PNB no perfodo t e uma fun5ao da oferta de moeda 
nos perfodos te(t — 1), bem como da variagao da oferta de moeda entre esses perfodos. 

a. Supondo que tenhamos os dados para estimar o modelo anterior, conseguiriamos estimar 
todos os coeficientes desse modelo? Por que? 

b. Em caso negativo, que coeficientes podem ser estimados? 

c. Suponha que os termos /J 3 M t ~\ estivessem ausentes do modelo. Sua resposta para (a) 
seria a mesma? 

d. Repita (c), supondo que os termos /l 2 M r estivessem ausentes do modelo. 

10.20. Mostre que as Equafoes (7.4.7) e (7.4.8) tambem podem ser expressas como 


a _ (£ ) (E At ) - (E yi**) (E ) 

(E4)( E4)(i-'2 2 3 ) 

a _ (Ei'^3i)(E4)- (Ei'i^i) (E^-^i) 

(E4)(E4)(i -4) 


em que r 23 e o coeficiente de correla9ao entre X 2 e X 3 . 

10.21. Usando as Equa5oes (7.4.12) e (7.4.15), mostre que, quando ha colinearidade perfeita, as 
variancias de P 2 e P 3 s ^° infinitas. 

10.22. Verifique se os erros padrao das somas desses coeficientes angulares estimados das Equates 
(10.5.6) e (10.5.7) sao, respectivamente, 0,1549 e 0,1825. (Veja a Sec^ao 10.5.) 

10.23. Para o modelo de regressao com k variaveis, pode-se mostrar que a variancia do fc-esimo coefi¬ 
ciente de regressao parcial (k — 2,3,...,K) dado em (7.5.6) tambem pode ser expresso como 1 


Opcional. 

t Esta formula e dada por STONE, R. "The analysis of market demand." Journal of the Royal Statistical Society, vl. 
B7, p. 297, 1945. Lembre-se tambem da Equagao (7.5.6). Para aprofundar a discussao, veja KENNEDY, Peter. 
A guide to econometrics. 2. ed. Cambridge, Mass.: The MIT Press, 1985. p. 156. 
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1 - R 2 

1 - Rl 


em que cr = variancia de Y, aj { = variancia da /c-esima variavel explanatoria, Rj : = R 2 do re¬ 
gressor de X k contra as variaveis X remanescentes, e R 2 = coeficiente de determina^ao da 
regressao multipla, ou seja, a regressao de Y em todas as variaveis X. 


Tudo o mais permanecendo constante, se a 2 k aumenta, o que acontece com a variancia de (i{! 
Quais as implica5oes em termos do problema da multicolinearidade? 

b. O que acontece com a formula anterior quando a colinearidade e perfeita? 

c. Verdadeiro ou falso: “A variancia de diminui quando R 2 aumenta, de modo que o efei- 


to de um Rl alto pode ser compensado por um R 2 alto”? 

10.24. Dos dados anuais para o setor de manufatura dos Estados Unidos para 1899—1922, Dougherty 
obteve os seguintes resultados de regressao:* 


log 7= 2,81 - 0,53 log K + 0,91 log L+ 0,047t 
ep= (1,38) (0,34) (0,14) (0,021) 

R 2 = 0,97 F= 189,8 


( 1 ) 


em que Y — fndice da produ£ao real, K — fndice do uso de capital real, L — fndice de uso real 
de mao de obra, t — tempo ou tendencia. 

Usando os mesmos dados, ele tambem obteve a seguinte regressao: 


log(7/E)=-0,11 + 0,11 log (K/L)+ 0,006 1 


( 2 ) 


ep = (0,03) (0,15) 


(0,006) 

R 2 = 0,65 F = 19,5 


a. Ha muticolinearidade na regressao (1)? Como podemos saber? 

b. Na regressao (1), o que e o sinal a priori de log K'! Os resultados correspondem a essa ex- 
pectativa? Por que? 

c. Como justificariamos a forma funcional de regressao (1)? ( Dica: fun§ao de produ5ao 
Cobb-Douglas.) 

d. Interprete a regressao (1). Qual o papel da variavel de tendencia nesta regressao? 

e. Qual a logica que esta por tras da regressao (2)? 

f. Se havia multicolinearidade na regressao (1), ela foi reduzida na regressao (2)? Como 
sabemos? 

g. Se a regressao (2) e uma versao restrita da regressao (1), qual e a restrii^ao imposta pelo 
autor? (Dica: retornos de escala.) Como poderfamos saber se essa restr^ao e valida? Que 
teste usamos? Mostre todos os calculos. 

h. Os valores de R 2 das duas regressoes sao comparaveis? Por que? Como poderfamos tor¬ 
nados comparaveis? 

10.25. Avalie criticamente as seguintes afirmafoes: 

a. “De fato, a multicolinearidade nao e um erro de modelagem. E uma condi5ao de dados 
deficientes. 1 

b. “Se nao for viavel obter mais dados, entao deve-se aceitar o fato de que os dados que se 
tem content uma quantidade limitada de informa9oes e devem simplificar o modelo de 
acordo. Tentar estimar modelos que sejam complicados demais e um dos erros mais co- 
muns entre econometristas inexperientes.’” 


* DOUGHERTY, Christopher. Introduction to econometrics. Nova York: Oxford University Press, 1992. p. 159-160. 
t CHATTERJEE, Samprit; HADI, Ali S.; PRICE, Bertram. Regression analysis by example. 3. ed. Nova York: John Wiley 
& Sons, 2000. p. 226. 

t DAVIDSON, Russel; MACKINNON, James C. Estimation and inference in econometrics. Nova York: Oxford University 
Press, 1993. p. 186. 
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c. “E comum os pesquisadores afirmarem que a multicolinearidade esta presente sempre 
que os sinais esperados nao aparecerem nos resultados da regressao, quando as variaveis 
que eles sabem, a priori, que sao importantes tem valores 1 insignificantes ou quando 
varios resultados de regressao sao substancialmente alterados sempre que uma variavel 
explanatoria e suprimida. Infelizmente, nenhuma dessas situates e necessaria ou sufi- 
ciente para a existencia de colinearidade e, alem disso, nenhuma preve sugestoes liteis 
quanto ao tipo de informa5oes adicionais que podem ser necessarias para resolver o pro- 
blema de estimagao que apresentam.”* 

d. “[...] qualquer regressao de series temporais que contenha mais de quatro variaveis independen- 
tes resulta em lixo.” t 

Exercfcios aplicados 

10.26. Klein e Goldberger tentaram ajustar o seguinte modelo de regressao para a economia dos 
Estados Unidos: 

Yj = Pi + /1 2 X 2 i + i + Pa^Ai + Ui 

em que Y = consumo, X 2 = renda salarial, X 3 = renda nao agricola, excluidos os salarios, e 
X 4 = renda agricola. Mas desde que se espera que X 2 , X 3 e X 4 sejam altamente colineares, eles 
obtiveram estimativas de /3 3 e p 4 com base nos dados de corte transversal, como se segue: 


TABELA 10.12 

Fonte: KLEIN, L. R.; 
Goldberger, A. S. An 
economic model in the 
United States, 1929-1952. 
Amsterda: North Holland 
Publishing Company, 1964. 
p. 131. 


Ano 

Y 

x 2 

*3 

*4 

Ano 

Y 

x 2 

Xb 

x 4 

1936 

62,8 

43,41 

17,10 

3,96 

1946 

95,7 

76,73 

28,26 

9,76 

1937 

65,0 

46,44 

18,65 

5,48 

1947 

98,3 

75,91 

27,91 

9,31 

1938 

63,9 

44,35 

17,09 

4,37 

1948 

100,3 

77,62 

32,30 

9,85 

1939 

67,5 

47,82 

19,28 

4,51 

1949 

103,2 

78,01 

31,39 

7,21 

1940 

71,3 

51,02 

23,24 

4,88 

1950 

108,9 

83,57 

35,61 

7,39 

1941 

76,6 

58,71 

28,11 

6,37 

1951 

108,5 

90,59 

37,58 

7,98 

1945* 

86,3 

87,69 

30,29 

8,96 

1952 

111,4 

95,47 

35,17 

7,42 


* Os dados para o perfodo de guerra 1942-1944 estao faltando; os relativos aos outros anos sao em bilhoes de dolares de 1939. 


P 3 = 0,75p 2 e p 4 — 0,625/S 2 . Usando essas estimativas, eles reformularam sua fun5ao de 
consumo da seguinte forma: 

Y, = P\ + p 2 {X 2 j + 0,75X3, + 0,625X4,) + Ui — P\ + p 2 Zt 4 
em que Z, = X 2 , + 0,75X 3; - + 0,625X4,-. 

a. Adapte o modelo modificado para os dados da Tabela 10.12 e obtenha estimativas de P\ 
para p 4 . 

b. Como voce interpreta a variavel Z? 

10.27. A Tabela 10.13 apresenta dados sobre as importa5oes, PIB, e Indice de Pre50s ao Consumi- 
dor (IPC) para os Estados Unidos durante o perfodo 1975-2005. Pede-se para considerar o 
seguinte modelo: 

In Importa5oes f — P\ + P 2 In PIB, + /1 3 In IPC, + u, 

a. Estime os parametros do modelo utilizando os dados apresentados na tabela. 

b. Voce acredita que ha multicolinearidade nos dados? 

c. Faqa a regressao: (1) In Importa9oes, = + A 2 In PIB 

(2) In Importa9oes, — B t + B 2 In IPC, 

(3) In PIB, = C, + C 2 In IPC, 


* Esta citajao e atribufda ao econometrista, Zvi Criliches. O trecho foi retirado de BERNDT, Ernst. The practice of 
econometrics: classic and contemporary. Reading, Mass.: Addison Wesley, 1991. p. 224. 
t GRENBERG, D. H.; KOSTERS, M. Income guarantees and the working poor. Rand Corporation, R-579-OEO, dez. 
1970. 
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TABELA 10.13 

Estados Unidos 
- [niportacoes, PIB e 
IPC, 1975-2005 (para 
todos os 
consumidores 
urbanos; 1982-1984 = 
100, exceto quando 
informado o 
contrario) 

Fonte: Department of Labor, 
Bureau of Labor Statistics. 


Ano 

IPC 

PIB 

Importances 

Ano 

IPC 

PIB 

Importances 

1975 

53,8 

1.638,3 

98185 

1991 

136,2 

5.995,9 

491020 

1976 

56,9 

1.825,3 

124228 

1992 

140,3 

6.337,7 

536528 

1977 

60,6 

2.030,9 

151907 

1993 

144,5 

6.657,4 

589394 

1978 

65,2 

2.294,7 

176002 

1994 

148,2 

7.072,2 

668690 

1979 

72,6 

2.563,3 

212007 

1995 

152,4 

7.397,7 

749374 

1980 

82,4 

2.789,5 

249750 

1996 

156,9 

7.816,9 

803113 

1981 

90,9 

3.128,4 

265067 

1997 

160,5 

8.304,3 

876470 

1982 

96,5 

3.225,0 

247642 

1998 

163,0 

8.747,0 

917103 

1983 

99,6 

3.536,7 

268901 

1999 

166,6 

9.268,4 

1029980 

1984 

103,9 

3.933,2 

332418 

2000 

172,2 

9.817,0 

1224408 

1985 

107,6 

4.220,3 

338088 

2001 

177,1 

10.128,0 

1145900 

1986 

109,6 

4.462,8 

368425 

2002 

179,9 

10.469,6 

1164720 

1987 

113,6 

4.739,5 

409765 

2003 

184,0 

10.960,8 

1260717 

1988 

118,3 

5.103,8 

447189 

2004 

188,9 

11.712,5 

1472926 

1989 

124,0 

5.484,4 

477665 

2005 

195,3 

12.455,8 

1677371 

1990 

130,7 

5.803,1 

498438 






Com base nessas regressoes, o que se pode dizer sobre a natureza da multicolinearidade nos dados? 
d. Suponha que haja multicolinearidade nos dados, mas /J 2 e /J 3 sejam individualmente signifi- 
cativos no nivel de 5% e que o teste F gcral tambem seja significativo. Nesse caso, deve- 
riamos bear preocupados com o problema da colinearidade? 

10.28. Retome o Exercicio 7.19 sobre a funqao demanda de frango nos Estados Unidos. 

a. Usando o modelo log linear, ou o log-log, estime as varias regressoes auxiliares. Quantas sao? 

b. Dessas regressoes auxiliares, como voce decide quais regressores sao altamente colinea- 
res? Qual teste podemos usar? Mostre os detalhes do calculo. 

c. Se ha colinearidade significativa nos dados, quais variaveis podem ser excluidas para 
reduzir a gravidade do problema da colinearidade? Se voce fizer isso, que problemas 
econometricos enfrentara? 

d. Voce tem sugestoes, alem de excluir variaveis, para atenuar o problema da colinearidade? 
Explique. 

10.29. A Tabela 10.14 apresenta dados sobre novos vefculos de passageiros vendidos nos Estados 
Unidos como liinqao de diversas variaveis. 

a. Desenvolva um modelo linear ou log linear adequado para estimar uma funnao de deman¬ 
da para automoveis nos Estados Unidos. 

b. Se decidir incluir todos os regressores apresentados na tabela como variaveis explanato- 
rias, como voce espera enfrentar o problema da multicolinearidade? Por que? 

c. Se espera enfrentar o problema da multicolinearidade, como pretende resolve-lo? Formu- 
le suas hipoteses com clareza e mostre todos os calculos explicitamente. 

10.30. Para avaliar a viabilidade de um salario anual garantido (imposto de renda negativo), a Rand 
Corporation conduziu um estudo a fim de medir a resposta da oferta de trabalho (media de 
horas trabalhadas) a salarios-hora crescentes.* Os dados para este estudo foram extraidos de uma 
amostra nacional de 6 mil domicilios chefiados por homens que ganhavam menos de $ 15 mil 
ao ano. Os dados foram divididos em 39 grupos demograficos para analise (veja a Tabela 
10.15). Uma vez que os dados referentes a quatro grupos desses estavam incompletos, na 
tabela so aparecem 35 grupos demograficos. As defini^oes das diversas variaveis usadas 
na analise estao no final da tabela. 

a. Fa§a a regressao das horas trabalhadas durante o ano contra as variaveis dadas na tabela 
e interprete sua regressao. 


* GREENBERG, D. H.; Kosters, M. Income garantees and the working poor. Rand Corporation, R-579-OEO, dez. 
1970. 
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TABELA 10.14 

Dados de vefculos de 
passageiros 

Fonte: Business Statistics, 
1986. Suplemento do 
Current Survey of Business, 
U.S. Department of 
Commerce. 1971 10.227 
112,0 121,3 776,8 4,89 
79.367 


Ano 

Y 

*2 

*3 

X 4 

*5 

x 6 

1971 

10.227 

112,0 

121,3 

776,8 

4,89 

79.367 

1972 

10.872 

111,0 

125,3 

839,6 

4,55 

82.153 

1973 

11.350 

111,1 

133,1 

949,8 

7,38 

85.064 

1974 

8.775 

117,5 

147,7 

1.038,4 

8,61 

86.794 

1975 

8.539 

127,6 

161,2 

1.142,8 

6,16 

85.846 

1976 

9.994 

135,7 

170,5 

1.252,6 

5,22 

88.752 

1977 

11.046 

142,9 

181,5 

1.379,3 

5,50 

92.017 

1978 

11.164 

153,8 

195,3 

1.551,2 

7,78 

96.048 

1979 

10.559 

166,0 

217,7 

1.729,3 

10,25 

98.824 

1980 

8.979 

179,3 

247,0 

1.918,0 

11,28 

99.303 

1981 

8.535 

190,2 

272,3 

2.127,6 

13,73 

100.397 

1982 

7.980 

197,6 

286,6 

2.261,4 

11,20 

99.526 

1983 

9.179 

202,6 

297,4 

2.428,1 

8,69 

100.834 

1984 

10.394 

208,5 

307,6 

2.670,6 

9,65 

105.005 

1985 

11.039 

215,2 

318,5 

2.841,1 

7,75 

107.150 

1986 

11.450 

224,4 

323,4 

3.022,1 

6,31 

109.597 


Y = vefculos de passageiros novos vendidos (milhares), nao ajustados sazonalmnente. 

X 2 = vefculos novos, Indice de Pregos ao Consumidor, 1967 = 100, nao ajustado sazonalmente. 

X 3 = Indice de Pregos ao Consumidor, todos os itens, todos os consumidores urbanos, 1967 = 100, nao ajustados sazonalmente. 
X 4 = renda pessoal disponfvel (RPD), em bilhoes de dolares, nao ajustado para variagao sazonal. 

X 5 = taxa de juros, percentual, dos titulos colocados diretamente pelas instituigdes financeiras. 

X 6 = forga de trabalho empregada (em milhares), nao ajustada para variagao sazonal. 


b. Ha evidencia de multicolinearidade nos dados? Como podemos saber? 

c. Calcule os fatores de inflaijao da variancia (FIV) e a TOL para os varios regressores. 

d. Se ha problema da multicolinearidade, que a9ao corretiva, se houver, pode ser tomada? 

e. O que este estudo informa sobre a viabilidade de um imposto de renda negativo? 

10.31. A Tabela 10.16 apresenta dados sobre a taxa de criminalidade em 45 Estados dos Estados 
Unidos para 1960. Tente desenvolver um modelo adequado para explicar a taxa de crimina¬ 
lidade em relac^ao as 14 variaveis socioeconomicas apresentadas na tabela. Atente, principal- 
mente, ao problema da colinearidade ao desenvolver seu modelo. 

10.32. Retome os dados de Longley da Se?ao 10.10. Repita a regressao da tabela, omitindo os dados 
para 1962; ou seja, faga a regressao para o perfodo de 1947-1961. Compare as duas regres- 
soes. A que conclusao geral voce chega com este exercicio? 

10.33. Dados de Longley atualizados. Ampliamos o rnimcro de dados apresentados na Sec^ao 10.10 
para incluir as observa5oes de 1959-2005. Os novos dados estao na Tabela 10.17. Eles estao 
ligados a: Y — numero de pessoas empregadas, em milhares; A, = deflator implicito do PNB; 
X 2 — PNB, em milhares de dolares; X 3 — numero de pessoas desempregadas, em milhares; 
X 4 — numero de pessoas nas for£as armadas, em milhares; X 5 = popula£ao nao instituciona- 
lizada com mais de 16 anos; X 6 — ano, igual a 1 em 1959, 2 em 1960 e 47 em 2005. 

a. Crie diagramas de dispersao como sugerido no capftulo para avaliar as redoes entre as 
variaveis independentes. As redoes sao fortes? Elas parecem lineares? 

b. Crie uma matriz de correla£ao. Quais variaveis parecem ser as mais relacionadas entre si, 
sem incluir a variavel dependente? 

c. Fa9a uma regressao MQO padrao para prever o numero de pessoas empregadas em mi¬ 
lhares. Os coeficientes das variaveis independentes comportam-se como esperado? 

d. Com base nos resultados, podemos acreditar que eles apresentam multicolinearidade? 

* 10.34. A medida que o queijo envelhece, varios processos qufmicos ocorrem, determinando o sabor 
do produto final. Os dados apresentados na Tabela 10.18 pertencem a concentra9oes de va¬ 
rios produtos qufmicos em uma amostra de 30 queijos cheddar maduros e medidas subjetivas 
de paladar para cada amostra. As variaveis acido acetico e H 2 S sao o logaritmo natural de 


Opcional. 
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concentrayao de acido acetico e acido sulfidrico, respectivamente. A variavel acido latico nao 

foi transformada em logaritmo. 

a. Trace um diagrama de dispersao das quatro variaveis. 

b. Faya uma regressao bivariada do paladar contra o acido acetico e H 2 S e interprete os re- 
sultados obtidos. 

c. Faya uma regressao bivariada do paladar contra o acido latico e H 2 S e interprete os resul- 
tados obtidos. 

d. Faya uma regressao multipla do paladar contra o acido acetico, H 2 S e acido latico. Inter¬ 
prete os resultados obtidos. 

e. Dados os seus conhecimentos sobre multicolinearidade, como decidiria entre essas re- 
gressoes? 

f. Que conclusoes gerais voce pode tirar de sua analise? 


TABELA 10.15 

Horas de trabalho e 
outros dados para 35 
grupos 

Fonte: GREENBERG, D. 
H.; ROSTERS. M. Income 
garantees and the working 
poor. Rand Corporation, 
R-579-OEO, dez. 1970. 


Observayao 

Horas 

Taxa 

GE 

GOM 

RNPT 

Ativos 

Idade 

DEP 

Escolaridade 

1 

2157 

2,905 

1121 

291 

380 

7250 

38,5 

2,340 

10,5 

2 

2174 

2,970 

1128 

301 

398 

7744 

39,3 

2,335 

10,5 

3 

2062 

2,350 

1214 

326 

185 

3068 

40,1 

2,851 

8,9 

4 

2111 

2,511 

1203 

49 

117 

1632 

22,4 

1,159 

11,5 

5 

2134 

2,791 

1013 

594 

730 

12710 

57,7 

1,229 

8,8 

6 

2185 

3,040 

1135 

287 

382 

7706 

38,6 

2,602 

10,7 

7 

2210 

3,222 

1100 

295 

474 

9338 

39,0 

2,187 

11,2 

8 

2105 

2,493 

1180 

310 

255 

4730 

39,9 

2,616 

9,3 

9 

2267 

2,838 

1298 

252 

431 

8317 

38,9 

2,024 

11,1 

10 

2205 

2,356 

885 

264 

373 

6789 

38,8 

2,662 

9,5 

11 

2121 

2,922 

1251 

328 

312 

5907 

39,8 

2,287 

10,3 

12 

2109 

2,499 

1207 

347 

271 

5069 

39,7 

3,193 

8,9 

13 

2108 

2,796 

1036 

300 

259 

4614 

38,2 

2,040 

9,2 

14 

2047 

2,453 

1213 

297 

139 

1987 

40,3 

2,545 

9,1 

15 

2174 

3,582 

1141 

414 

498 

10239 

40,0 

2,064 

11,7 

16 

2067 

2,909 

1805 

290 

239 

4439 

39,1 

2,301 

10,5 

17 

2159 

2,511 

1075 

289 

308 

5621 

39,3 

2,486 

9,5 

18 

2257 

2,516 

1093 

176 

392 

7293 

37,9 

2,042 

10,1 

19 

1985 

1,423 

553 

381 

146 

1866 

40,6 

3,833 

6,6 

20 

2184 

3,636 

1091 

291 

560 

11240 

39,1 

2,328 

11,6 

21 

2084 

2,983 

1327 

331 

296 

5653 

39,8 

2,208 

10,2 

22 

2051 

2,573 

1194 

279 

172 

2806 

40,0 

2,362 

9,1 

23 

2127 

3,262 

1226 

314 

408 

8042 

39,5 

2,259 

10,8 

24 

2102 

3,234 

1188 

414 

352 

7557 

39,8 

2,019 

10,7 

25 

2098 

2,280 

973 

364 

272 

4400 

40,6 

2,661 

8,4 

26 

2042 

2,304 

1085 

328 

140 

1739 

41,8 

2,444 

8,2 

27 

2181 

2,912 

1072 

304 

383 

7340 

39,0 

2,337 

10,2 

28 

2186 

3,015 

1122 

30 

352 

7292 

37,2 

2,046 

10,9 

29 

2188 

3,010 

990 

366 

374 

7325 

38,4 

2,847 

10,6 

30 

2077 

1,901 

350 

209 

95 

1370 

37,4 

4,158 

8,2 

31 

2196 

3,009 

947 

294 

342 

6888 

37,5 

3,047 

10,6 

32 

2093 

1,899 

342 

311 

120 

1425 

37,5 

4,512 

8,1 

33 

2173 

2,959 

1116 

296 

387 

7625 

39,2 

2,342 

10,5 

34 

2179 

2,971 

1128 

312 

397 

7779 

39,4 

2,341 

10,5 

35 

2200 

2,980 

1126 

204 

393 

7885 

39,2 

2,341 

10,6 


Notas: Horas = horas medias trabalhadas durante o ano. 

Taxa = salario medio por hora, em dolares. 

GE = ganhos anuais medios da esposa, em dolares. 

GOM = ganhos anuais medios de outros membros da famflia, em dolares. 
RNPT = renda nao proveniente de trabalho, media anual. 

Ativos = ativos medios da famflia (poupan 5 a etc.), em dolares. 

Idade = idade media dos entrevistados. 

DEP = numero medio de dependentes. 

Escolaridade = numero medio de anos de estudo. 
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TABELA 10.16 Dados da taxa de criminalidade para 47 Estados dos Estados Unidos em 1960 


Observagao 

T 

Idade 

s 

ESCO 

DESP 0 

DESP, 

FT 

H 

POP, 

NB 

D, 

D 2 

VBAT 

X 

1 

79,1 

151 

1 

91 

58 

56 

510 

950 

33 

301 

108 

41 

394 

261 

2 

163,5 

143 

0 

113 

103 

95 

583 

1012 

13 

102 

96 

36 

557 

194 

3 

57,8 

142 

i 

89 

45 

44 

533 

969 

18 

219 

94 

33 

318 

250 

4 

196,9 

136 

0 

121 

149 

141 

577 

994 

157 

80 

102 

39 

673 

167 

5 

123,4 

141 

0 

121 

109 

101 

591 

985 

18 

30 

91 

20 

578 

174 

6 

68,2 

121 

0 

110 

118 

115 

547 

964 

25 

44 

84 

29 

689 

126 

7 

96,3 

127 

1 

111 

82 

79 

519 

982 

4 

139 

97 

38 

620 

168 

8 

155,5 

131 

1 

109 

115 

109 

542 

969 

50 

179 

79 

35 

472 

206 

9 

85,6 

157 

1 

90 

65 

62 

553 

955 

39 

286 

81 

28 

421 

239 

10 

70,5 

140 

0 

118 

71 

68 

632 

1029 

7 

15 

100 

24 

526 

174 

11 

167,4 

124 

0 

105 

121 

116 

580 

966 

101 

106 

77 

35 

657 

170 

12 

84,9 

134 

0 

108 

75 

71 

595 

972 

47 

59 

83 

31 

580 

172 

13 

51,1 

128 

0 

113 

67 

60 

624 

972 

28 

10 

77 

25 

507 

206 

14 

66,4 

135 

0 

117 

62 

61 

595 

986 

22 

46 

77 

27 

529 

190 

IS 

79,8 

152 

1 

87 

57 

53 

530 

986 

30 

72 

92 

43 

405 

264 

16 

94,6 

142 

1 

88 

81 

77 

497 

956 

33 

321 

116 

47 

427 

247 

17 

53,9 

143 

0 

110 

66 

63 

537 

977 

10 

6 

114 

35 

487 

166 

18 

92,9 

135 

1 

104 

123 

115 

537 

978 

31 

170 

89 

34 

631 

165 

19 

75,0 

130 

0 

116 

128 

128 

536 

934 

51 

24 

78 

34 

627 

135 

20 

122,5 

125 

0 

108 

113 

105 

567 

985 

78 

94 

130 

58 

626 

166 

21 

74,2 

126 

0 

108 

74 

67 

602 

984 

34 

12 

102 

33 

557 

195 

22 

43,9 

157 

1 

89 

47 

44 

512 

962 

22 

423 

97 

34 

288 

276 

23 

121,6 

132 

0 

96 

87 

83 

564 

953 

43 

92 

83 

32 

513 

227 

24 

96,8 

131 

0 

116 

78 

73 

574 

1038 

7 

36 

142 

42 

540 

176 

25 

52,3 

130 

0 

116 

63 

57 

641 

984 

14 

26 

70 

21 

486 

196 

26 

199,3 

131 

0 

121 

160 

143 

631 

1071 

3 

77 

102 

41 

674 

152 

27 

34,2 

135 

0 

109 

69 

71 

540 

965 

6 

4 

80 

22 

564 

139 

28 

121,6 

152 

0 

112 

82 

76 

571 

1018 

10 

79 

103 

28 

537 

215 

29 

104,3 

119 

0 

107 

166 

157 

521 

938 

168 

89 

92 

36 

637 

154 

30 

69,6 

166 

1 

89 

58 

54 

521 

973 

46 

254 

72 

26 

396 

237 

31 

37,3 

140 

0 

93 

55 

54 

535 

1045 

6 

20 

135 

40 

453 

200 

32 

75,4 

125 

0 

109 

90 

81 

586 

964 

97 

82 

105 

43 

617 

163 

33 

107,2 

147 

1 

104 

63 

64 

560 

972 

23 

95 

76 

24 

462 

233 

34 

92,3 

126 

0 

118 

97 

97 

542 

990 

18 

21 

102 

35 

589 

166 

35 

65,3 

123 

0 

102 

97 

87 

526 

948 

113 

76 

124 

50 

572 

158 

36 

127,2 

150 

0 

100 

109 

98 

531 

964 

9 

24 

87 

38 

559 

153 

37 

83,1 

177 

1 

87 

58 

56 

638 

974 

24 

349 

76 

28 

382 

254 

38 

56,6 

133 

0 

104 

51 

47 

599 

1024 

7 

40 

99 

27 

425 

225 

39 

82,6 

149 

1 

88 

61 

54 

515 

953 

36 

165 

86 

35 

395 

251 

40 

115,1 

145 

1 

104 

82 

74 

560 

981 

96 

126 

88 

31 

488 

228 

41 

88,0 

148 

0 

122 

72 

66 

601 

998 

9 

19 

84 

20 

590 

144 

42 

54,2 

141 

0 

109 

56 

54 

523 

968 

4 

2 

107 

37 

489 

170 

43 

82,3 

162 

1 

99 

75 

70 

522 

996 

40 

208 

73 

27 

496 

224 

44 

103,0 

136 

0 

121 

95 

96 

574 

1012 

29 

36 

111 

37 

622 

162 

45 

45,5 

139 

1 

88 

46 

41 

480 

968 

19 

49 

135 

53 

457 

249 

46 

50,8 

126 

0 

104 

106 

97 

599 

989 

40 

24 

78 

25 

593 

171 

47 

84,9 

130 

0 

121 

90 

91 

623 

1049 

3 

22 

113 

40 

588 

160 


Definigoes das variaveis: 

T = taxa de criminalidade, numero de delitos relatados a policia por milhao de pessoas. 

Idade = numero de homens com 14 a 24 anos por 1.000 pessoas 
S = variavel indicador para Estados do Sul (0 = nao, 1 = sim) 

ESCO = numero medio de anos de escolaridade vezes 10 para pessoas acima de 25 anos 
DESPq = despesas per capita de 1960 com policia por Estado e governo local 
DESPj = despesa per capita de 1959 com policia por Estado e governo local. 

FT = participagao na forga de trabalho por 1.000 homens civis urbanos com 14-24 anos de idade 
H = numero de homens por 1.000 mulheres 
POP i = tamanho da populagao do Estado em centenas de milhares 
NB = numero de nao brancos por populagao de 1.000 
Z)j = taxa de desemprego de homens urbanos por 1.000 com 14-24 anos 
D 2 = taxa de desemprego de homens urbanos por 1.000 com 35-39 anos 
VBAT = valor medio de bens e ativos transferfveis ou renda familiar em dezenas de $ 

X = numero de famflias por 1.000 com ganhos Vi da renda media 
Observagao = Estado (47 Estados para o ano de 1960) 


Fonte: VANDAELE, W. “Participation in illegitimate activities: Erlich revisted”. In: BLUMSTEIN, A.; COHEN, J.; NAGIN, D. (Eds.). Deterrence and incapacitation. 
National Academy of Sciences, 1978. p. 270-335. 
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TABELA 10.17 

Dados atualizados de 
Longley, 1959-2005 

Fonte: Department of Labor, 
Bureau of Labor Statistics e 
http://siadapp.dmdc.osd.mil/ 
persormel/MILITARY/ 
Miltop. htm. 


Observafao 

Y 


*2 

*3 

X 4 

*5 

*6 

1959 

64.630 

82,908 

509.300 

3.740 

2552 

120.287 

1 

1960 

65.778 

84,074 

529.500 

3.852 

2514 

121.836 

2 

1961 

65.746 

85,015 

548.200 

4.714 

2573 

123.404 

3 

1962 

66.702 

86,186 

589.700 

3.911 

2827 

124.864 

4 

1963 

67.762 

87,103 

622.200 

4.070 

2737 

127.274 

5 

1964 

69.305 

88,438 

668.500 

3.786 

2738 

129.427 

6 

1965 

71.088 

90,055 

724.400 

3.366 

2722 

131.541 

7 

1966 

72.895 

92,624 

792.900 

2.875 

3123 

133.650 

8 

1967 

74.372 

95,491 

838.000 

2.975 

3446 

135.905 

9 

1968 

75.920 

99,56 

916.100 

2.817 

3535 

138.171 

10 

1969 

77.902 

104,504 

990.700 

2.832 

3506 

140.461 

11 

1970 

78.678 

110,046 

1.044.900 

4.093 

3188 

143.070 

12 

1971 

79.367 

115,549 

1.134.700 

5.016 

2816 

145.826 

13 

1972 

82.153 

120,556 

1.246.800 

4.882 

2449 

148.592 

14 

1973 

85.064 

127,307 

1.395.300 

4.365 

2327 

151.476 

15 

1974 

86.794 

138,82 

1.515.500 

5.156 

2229 

154.378 

16 

1975 

85.846 

151,857 

1.651.300 

7.929 

2180 

157.344 

17 

1976 

88.752 

160,68 

1.842.100 

7.406 

2144 

160.319 

18 

1977 

92.017 

1 70,884 

2.051.200 

6.991 

2133 

163.377 

19 

1978 

96.048 

182,863 

2.316.300 

6.202 

2117 

166.422 

20 

1979 

98.824 

198,077 

2.595.300 

6.137 

2088 

169.440 

21 

1980 

99.303 

216,073 

2.823.700 

7.637 

2102 

172.437 

22 

1981 

100.397 

236,385 

3.161.400 

8.273 

2142 

1 74.929 

23 

1982 

99.526 

250,798 

3.291.500 

10.678 

2179 

177.176 

24 

1983 

100.834 

260,68 

3.573.800 

10.717 

2199 

179.234 

25 

1984 

105.005 

270,496 

3.969.500 

8.539 

2219 

181.192 

26 

1985 

107.150 

278,759 

4.246.800 

8.312 

2234 

183.174 

27 

1986 

109.597 

284,895 

4.480.600 

8.237 

2244 

185.284 

28 

1987 

112.440 

292,691 

4.757.400 

7.425 

2257 

187.419 

29 

1988 

114.968 

302,68 

5.127.400 

6.701 

2224 

189.233 

30 

1989 

117.342 

314,179 

5.510.600 

6.528 

2208 

190.862 

31 

1990 

118.793 

326,357 

5.837.900 

7.047 

2167 

192.644 

32 

1991 

117.718 

337,747 

6.026.300 

8.628 

2118 

194.936 

33 

1992 

118.492 

345,477 

6.367.400 

9.613 

1966 

197.205 

34 

1993 

120.259 

353,516 

6.689.300 

8.940 

1760 

199.622 

35 

1994 

123.060 

361,026 

7.098.400 

7.996 

1673 

201.970 

36 

1995 

124.900 

368,444 

7.433.400 

7.404 

1579 

204.420 

37 

1996 

126.708 

375,429 

7.851.900 

7.236 

1502 

207.087 

38 

1997 

129.558 

381,663 

8.337.300 

6.739 

1457 

209.846 

39 

1998 

131.463 

385,881 

8.768.300 

6.210 

1423 

212.638 

40 

1999 

1 33.488 

391,452 

9.302.200 

5.880 

1380 

215.404 

41 

2000 

136.891 

399,986 

9.855.900 

5.692 

1405 

218.061 

42 

2001 

1 36.933 

409,582 

10.171.600 

6.801 

1412 

220.800 

43 

2002 

136.485 

416,704 

10.500.200 

8.378 

1425 

223.532 

44 

2003 

137.736 

425,553 

11.017.600 

8.774 

1423 

226.223 

45 

2004 

139.252 

437,795 

11.762.100 

8.149 

1411 

228.892 

46 

2005 

141.730 

451,946 

12.502.400 

7.591 

1378 

231.552 

47 
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TABELA 10.18 

Qufmicos em queijos 

Fonte: disponivel em: http:// 
lib.stat.cmu.edu/ DASL/ 
Datafiles/Cheese.html. 


Obs. 

Paladar 

Acido Acetico 

h 2 s 

Acido Latico 

1 

12,30000 

4,543000 

3,135000 

0,860000 

2 

20,90000 

5,159000 

5,043000 

1,530000 

3 

39,00000 

5,366000 

5,438000 

1,570000 

4 

47,90000 

5,759000 

7,496000 

1,810000 

5 

5,600000 

4,663000 

3,807000 

0,990000 

6 

25,90000 

5,697000 

7,601000 

1,090000 

7 

37,30000 

5,892000 

8,726000 

1,290000 

8 

21,90000 

6,078000 

7,966000 

1,780000 

9 

18,10000 

4,898000 

3,850000 

1,290000 

10 

21,00000 

5,242000 

4,174000 

1,580000 

11 

34,90000 

5,740000 

6,142000 

1,680000 

12 

57,20000 

6,446000 

7,908000 

1,900000 

13 

0,700000 

4,477000 

2,996000 

1,060000 

14 

25,90000 

5,236000 

4,942000 

1,300000 

15 

54,90000 

6,151000 

6,752000 

1,520000 

16 

40,90000 

3,365000 

9,588000 

1,740000 

17 

1 5,90000 

4,787000 

3,912000 

1,160000 

18 

6,400000 

5,142000 

4,700000 

1,490000 

19 

18,00000 

5,247000 

6,174000 

1,630000 

20 

38,90000 

5,438000 

9,064000 

1,990000 

21 

14,00000 

4,564000 

4,949000 

1,150000 

22 

15,20000 

5,298000 

5,220000 

1,330000 

23 

32,00000 

5,455000 

9,242000 

1,440000 

24 

56,70000 

5,855000 

10,19900 

2,010000 

25 

16,80000 

5,366000 

3,664000 

1,310000 

26 

11,60000 

6,043000 

3,219000 

1,460000 

27 

26,50000 

6,458000 

6,962000 

1,720000 

28 

0,700000 

5,328000 

3,912000 

1,250000 

29 

1 3,40000 

5,802000 

6,685000 

1,080000 

30 

5,500000 

6,176000 

4,787000 

1,250000 




Capitulo 

Heterocedasticidade: o que 
acontece se a variancia do 
erro nao e constante? 



Uma hipotese importante do modelo classico de regressao linear (Hipotese 4) e que os termos de erro 
iij que aparecem na fungao de regressao populacional sao homocedasticos; ou seja, todos tem a mesma 
variancia. Neste capitulo, examinaremos a validade dessa hipotese e descobriremos o que acontece quan- 
do ela nao e constatada. Como no Capitulo 10, buscamos respostas as seguintes questoes: 

1. Qual a natureza da heterocedasticidade? 

2. Quais suas consequencias? 

3. Como e detectada? 

4. Quais as medidas corretivas? 


11.1 A natureza da heterocedasticidade 

Como observado no Capitulo 3, uma das hipoteses importantes do modelo classico de regressao 
linear e que a variancia de cada termo de erro u p condicional aos valores selecionados das variaveis 
explanatorias, e um niimero constante igual a a 2 . Essa e a hipotese da homocedasticidade, ou seja, 
igual ou homogeneo (homo) espcilhamento (cedasticidade), isto e, variancia igual. Simbolicamente, 

E(u])=o 2 i = 1,2,... ,n T 

A homocedasticidade do modelo de regressao com duas variaveis pode ser mostrada como o 
grafico da Figura 3.4, o qual, por conveniencia, e reproduzido como Figura 11.1. Nessa figura, a va¬ 
riancia condicional de Y t (que e igual a de m,), condicionada ao X, dado, permanece a mesma, indepen- 
dentemente dos valores assumidos pela variavel X. 

Em contrapartida, considere a Figura 11.2, que mostra que a variancia condicional de Y t aumenta 
a medida que X aumenta. Nesse caso, as variancias de Y; nao sao as mesmas. Portanto, ha heteroce¬ 
dasticidade. Simbolicamente, 

£ '( M ?) =or / 2 11.1.2 

Note o subscrito de cr, que nos lembra que as variancias condicionais de m, (= variancias condicionais 
de Yj) nao sao mais constantes. 

Para deixar clara a diferenga entre homocedasticidade e heterocedasticidade, suponha que, no 
modelo de duas variaveis Y, = + ft 2 X / + u h Y represente poupanga e X represente renda. As Figuras 

11.1 e 11.2 mostram que a medida que a renda aumenta, as poupangas tambem aumentam. Mas na 
Figura 11.1a variancia das poupangas permanece a mesma em todos os nfveis de renda, enquanto 
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FIGURA 11.1 

Erros 

homocedasticos. 



FIGURA 11.2 

Erros 

heterocedasticos. 



na Figura 11.2 ela aumenta com a renda. Parece que na Figura 11.2 as famflias com rendas mais altas 
poupam, em media, mais do que as familias com rendas mais baixas, mas tambem ha mais variabili- 
dade em suas poupan£as. 

Varias sao as razoes para as variancias de u [ poderem ser variaveis, algumas das quais sao dadas 
a seguir. 1 

1. Seguindo os modelos de erro-aprendizagem, comportamentos incorretos das pessoas dimi- 
nuem com o tempo ou o numero de erros toma-se mais consistente. Neste caso, espera-se 
que of diminua. Como exemplo, considere a Figura 11.3, que relaciona o numero de erros de 
digita^ao cometidos em um dado perfodo de tempo em um teste com as horas de pratica 
de digita£ao. Como mostra a Figura 11.3, quando o numero de horas de digita§ao aumenta, 
o numero medio de erros de digita§ao, bem como suas variancias, diminui. 

2. A medida que a renda aumenta, as pessoas tem mais renda discricionaria 2 e, portanto, mais 
opcocs para escolher como aplicarao sua renda. Por isso, e provavel que of aumente com a 
renda. Assim, na regressao de poupan 9 as contra a renda e provavel que se verifique que erf 
aumenta com a renda (como na Figura 11.2), porque as pessoas tem mais op 5 ao sobre como 
irao dispor de suas poupan§as. Do mesmo modo, em geral se espera que as empresas com lu- 
cros maiores mostrem maior variabilidade em suas polfticas de dividendos que aquelas com 
lucros mais baixos. Alem disso, as empresas em crescimento provavelmente mostram mais 
variabilidade em suas polfticas de distribu^ao de dividendos do que as ja estabelecidas. 


1 Veja VALAVANIS, Stefan. Econometrics. Nova York: McGraw-Hiull, 1959. p. 48. 

2 Como Valavanis (Ibid. p. 48) afirma, "A renda cresce, e as pessoas agora mal diferenciam dolares enquanto an- 
teriormente elas diferenciavam centavos". 
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FIGURA 11.3 

Uustragao de 
heterocedasticidade. 





3. A medida que as tecnicas de coleta de dados aprimoram-se, e provavel que oj diminua. As- 
sim, os bancos que tem equipamentos sofisticados de processamento de dados provavelmente 
cometem menos erros nos demonstratives mensais ou trimestrais de seus clientes do que bancos 
sem esses recursos. 

4. A heterocedasticidade tambem ocorre como resultado da presenga de dados discrepantes 
(outliers). Uma observagao discrepante e aquela que difere muito (muito menor ou muito 
maior) em relagao as observagoes da amostra. Em termos mais exatos, um dado discrepante e 
a observagao de uma populagao que difere daquela que gera as observagoes amostradas rema- 
nescentes. 3 A inclusao ou exclusao de tal observagao, principalmente quando o tamanho da 
amostra for menor, pode alterar substancialmente os resultados da analise de regressao. 

Como exemplo, considere o diagrama de dispersao dado na Figura 11.4. Com base nos da¬ 
dos da Tabela 11.9, no Exercicio 11.22, este grafico traga a taxa de variagao percentual dos 
pregos das agoes ( Y) e dos pregos ao consumidor (X) para o perfodo que vai do pos-guerra 
(1945) ate 1969 para 20 paises. Nessa figura, a observagao em Y e X para o Chile pode ser 
considerada um dado discrepante, porque os valores apresentados para Y e X sao muito maio- 
res do que para os demais paises. Em situagoes como essa, seria difrcil manter a hipotese da 
homocedasticidade. No Exercicio 11.22, pedem-se para descobrir o que acontece com os 
resultados da regressao quando as observagoes para o Chile sao excluidas da analise. 

5. Outra fonte de heterocedasticidade surge da violagao da Hipotese 9 do modelo classico de regres¬ 
sao linear (MCRL), a saber, que o modelo de regressao deve ser especificado corretamente. 
Discutiremos os erros de especificagao com mais detalhes no Capitulo 13; mas vale dizer, por ora, 
que muitas vezes algumas variaveis importantes sao omitidas do modelo e isso nos da a impres- 
sao de tratar-se de heterocedasticidade. Assim, na fungao demanda de um produto, se deixamos 
de incluir os pregos de produtos complementares ou concorrentes (o vies da variavel omitida), os 
resfduos obtidos da regressao podem dar a impressao nrtida de que a variancia do erro nao e 
constante. Mas, uma vez inclufdas as variaveis omitidas no modelo, esse equfvoco desfaz-se. 
Para um exemplo concreto, voltemos ao nosso estudo sobre a retengao de lembrangas de 
antincios em relagao as despesas com publicidade (X). (Veja o Exercicio 8.32.) Se voce fizer 
a regressao apenas de Y contra X e observa os resfduos dessa regressao, vera um padrao, mas, 
se voce regridir Y contra X e X 2 , vera outro padrao, que pode ser identificado claramente na 
Figura 11.5. Ja vimos que X 1 pertence ao modelo. (Veja o Exercicio 8.32.) 

6. Outra fonte de heterocedasticidade e a assimetria na distribuigao de um ou mais regressores 
incluidos no modelo. Exemplos sao variaveis economicas como renda, liqueza e educagao. 
Sabe-se que a distribuigao de renda e riqueza na maioria das sociedades e desigual, cabendo 
o grosso da renda e riqueza a uma parcela mrnima da populagao. 


3 Sou grato a Michael McAleer por ter apontado este aspecto. 
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FIGURA 11.4 

Rela§ao entre os 
pregos das agoes e 
prefos ao consumidor. 


FIGURA 11.5 

Resfduos da regressao 
de (a) percepgoes 
sobre despesas com 
publicidade e ( b ) 
percep§oes sobre 
despesas de 
publicidade e o 
quadrado de despesas 
com publicidade. 
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7. Outras fontes de heterocedasticidade: como David Hendry observa, a heterocedasticidade 
tambem pode surgir (1) da transformapao incorreta de dados (por exemplo, transformapoes 
proporcionais ou de primeira diferenpa) e (2) da forma funcional incorreta (por exemplo, 
modelos lineares versus log-lineares). 4 

Note que o problema da heterocedasticidade provavelmente e mais comum nos dados de 
corte transversal do que nas series temporais. Nos primeiros, em geral se lida com membros 
de uma popula£ao em determinado ponto no tempo, como consumidores individuals ou suas 
familias, empresas, setores industrials ou subdivisoes geograficas como Estado, pais, cidade 
etc. Alem disso, esses integrantes podem ser de diferentes tamanhos, como empresas peque- 
nas, medias ou grandes ou renda baixa, media ou alta. Nas series temporais, por outro lado, 
as variaveis tendem a ser de ordens de magnitude similares, porque os dados costumam ser 
coletados para a mesma entidade em um periodo de tempo. Exemplos: o produto nacional 
bruto (PNB), gastos com consumo, poupan 5 a ou emprego nos Estados Unidos, para um pe¬ 
riodo, por exemplo, de 1955-2005. 

Para ilustrar a heterocedasticidade que provavelmente sera encontrada na analise de corte 
transversal, veja a Tabela 11.1. Esta apresenta dados sobre a remuneragao por funcionario 
em 10 ramos de bens nao duraveis, classificados pelo numero de funcionarios da empresa ou 
estabelecimento no ano de 1958. A tabela tambem da a produtividade media para nove cate- 
gorias de emprego. 




4 HENDRY, David F. Dynamic econometrics. Nova York: Oxford University Press, 1995. p. 45. 
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TABELA 11.1 Remuneragao por funcionario f$) em setores de produgao de bens nao duraveis de acordo com o numero de funcio¬ 
narios, 1958 


Numero de Funcionarios (numero medio de funcionarios) 


Setor 

1-4 

5-9 

10-19 

20-49 

50-99 

100-249 

250-499 

500-999 

1.000-2.499 

Alimentos e 
produtos 
alimentfcios 

2.994 

3.295 

3.565 

3.907 

4.189 

4.486 

4.676 

4.968 

5.342 

Fumo 

1.721 

2.057 

3.336 

3.320 

2.980 

2.848 

3.072 

2.969 

3.822 

Textil 

3.600 

3.657 

3.674 

3.437 

3.340 

3.334 

3.225 

3.163 

3.168 

Vestuario 

3.494 

3.787 

3.533 

3.215 

3.030 

2.834 

2.750 

2.967 

3.453 

Papelaria 

3.498 

3.847 

3.913 

4.135 

4.445 

4.885 

5.132 

5.342 

5.326 

Crafica e 
editoragao 

3.611 

4.206 

4.695 

5.083 

5.301 

5.269 

5.182 

5.395 

5.552 

Produtos quimicos 
e derivados 

3.875 

4.660 

4.930 

5.005 

5.114 

5.248 

5.630 

5.870 

5.876 

Produtos deriva¬ 
dos de petroleo 
e carvao 

4.616 

5.181 

5.317 

5.337 

5.421 

5.710 

6.316 

6.455 

6.347 

Derivados de 
borracha e 
plastico 

3.538 

3.984 

4.014 

4.287 

4.221 

4.539 

4.721 

4.905 

5.481 

Couro e derivados 

3.016 

3.196 

3.149 

3.317 

3.414 

3.254 

3.177 

3.346 

4.067 

Remuneragao 

media 

3.396 

3.787 

4.013 

4.104 

4.146 

4.241 

4.388 

4.538 

4.843 

Desvio padrao 

742,2 

851,4 

727,8 

805,06 

929,9 

1.080,6 

1.241,2 

1.307,7 

1.110,7 

Produtividade 

media 

9.355 

8.584 

7.962 

8.275 

8.389 

9.418 

9.795 

10.281 

11.750 


Fonte: The Census of Manufactures, U.S. Department of Commerce, 1958 (elaborado pelo autor). 


FIGURA 11.6 

Desvio padrao da 
remuneragao e 
remuneragao media. 
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Embora os setores difiram na composipao de seus produtos, a Tabela 11.1 mostra claramente que 
em media as empresas grandes pagam mais do que as pequenas. Por exemplo, empresas com um a 
quatro funcionarios pagavam em media $ 3.396, enquanto aquelas que empregavam de 1.000 a 2.499 
funcionarios pagavam em media cerca de $ 4.843. Note que ha uma variabilidade consideravel na 
remunera 5 ao entre varias categorias, como indicado pelos desvios padrao estimados das remunera- 
poes. Isso pode ser observado tambem na Figura 11.6, que mostra o grafico do desvio padrao da re- 
munerapao e a remunera 9 ao media em cada categoria de emprego. Como podemos ver claramente, 
em media o desvio padrao da remunera 9 ao aumenta com o valor medio da remunera 9 ao. 


11.2 Estimativa dos MQO na presen^a da heterocedasticidade 

O que acontece com os rmnimos quadrados ordinarios (MQO) e suas variancias se introduzirmos 
a heterocedasticidade fazendo E(uf) = of, mas mantivermos todas as demais hipoteses do modelo 
classico? Para responder a essa pergunta, tomamos o modelo de duas variaveis: 

Yi = P i + Pi X i + Hi 


Aplicando a formula usual, o estimador de MQO de p 2 e: 


Pi 


H x iyi 

Ex , 2 

nY.XjYj ~ J2 x iT, Y > 

nJ2 x f~ (EE) 2 


( 11 . 2 . 1 ) 


mas a variancia agora e dada pela expressao a seguir (veja o Apendice 11 A, Sepao 11 A. 1): 


var (/j 2 ) = 


E^ 

(Ex, 2 ) 2 


( 11 . 2 . 2 ) 


que obviamente e diferente da formula usual de variancia obtida, supondo-se a homocedasticidade, a 
saber: 


var (P 2 ) = 



(11.2.3) 


Evidentemente, se of = cr para cada i, as duas formulas serao identicas. (Por que?) 

Lembre-se de que P 2 sera o melhor estimador linear nao tendencioso (MELNT) se as hipoteses do 
modelo classico, que incluem a homocedasticidade, forem validas. Ele ainda sera MELNT quando 
excluirmos a hipotese da homocedasticidade e substituirmos pela da heterocedasticidade? E facil 
provar que /Lconscrva-sc linear e nao tendencioso. Na verdade, como mostra o Apendice 3 A, Sepao 
3A.2, para estabelecer a nao tendenciosidade de p 2 , nao e necessario que os termos de erro (u,) sejam 
homocedasticos. De fato, a variancia de homoscedastica ou heteroscedastica, nao desempenha papel 
na determinapao da propriedade da tendencia. Lembre-se de que, no Apendice 3A, Sepao 3A.7, mostra- 
mos que p 2 e um estimador consistente sob as hipoteses do modelo classico de regressao linear. 
Apesar da heterocedasticidade, pode-se indicar que p 2 e um estimador consistente, embora nao fa 9 a- 
mos a prova disso; ou seja, quando o tamanho da amostra aumenta indefinidamente, o P 2 estimado 
converge para seu verdadeiro valor. Alem do mais, tambem pode ser mostrado que, sob certas cond^oes 
(chamadas condi 9 oes de regularidade), p 2 e assintoticamente normalmente distribuido. O que dissemos 
sobre p 2 tambem e valido para outros parametros de modelo de regressao multipla. 
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Admitindo-se que fi 2 ainda seja linear, nao tendencioso e consistente, ele e “eficiente” ou “me- 
lhor”? Isto e, ele tem a variancia minima na classe dos estimadores nao tendenciosos? E essa va¬ 
riancia minima e dada pela Equagao (11.2.2)? A resposta e nao a ambas as perguntas: ft 2 deixa de 
ser o melhor e a variancia minima nao e dada pela Equagao (11.2.2). Entao, qual e o estimador 
MELNT na presenga da heterocedasticidade? A resposta e dada na segao a seguir. 


11.3 O metodo dos mfnimos quadrados generalizados (MQG) 

Por que o estimador comum MQO de fi 2 apresentado na Equagao (11.2.1) nao e mais o melhor, 
embora nao seja tendencioso? Intuitivamente, podemos entender a razao para isso por meio da Tabe- 
la 11.1. Como a tabela mostra, ha variabilidade consideravel na remuneragao dos assalariados. Se 
tivessemos de fazer a regressao da remuneragao por funcionario contra o numero de funcionarios, 
pensariamos em levar em consideragao a existencia de uma variabilidade consideravel entre as cate¬ 
gories, em termos de vencimentos. Em termos ideais, gostariamos de sugerir um esquema de estima- 
gao de modo que as observagoes vindas de populagoes com maior variabilidade recebam menos peso 
do que aquelas provenientes de populagoes com menor variabilidade. Examinando a Tabela 11.1, 
gostariamos de atribuir maior peso as observagoes vindas das categorias de emprego 10-19 e 20-49 
do que as vindas de categorias de emprego como 5-9 e 250-499, pois as primeiras agrupam-se mais 
em torno de seus valores medios do que as ultimas, e dessa forma nos permitem estimar a fungao de 
regressao da populagao (FRP) com mais precisao. 

Infelizmente o metodo dos MQO de emprego nao segue essa estrategia e, portanto, nao usa as 
“informagoes” contidas na variabilidade desigual da variavel dependente Y, ou seja, na remuneragao 
dos funcionarios da Tabela 11.1, ela atribui pesos ou importancias iguais a cada observagao. Mas um 
metodo de estimagao, conhecido como minimos quadrados generalizados (MQG), leva tais infor¬ 
magoes em consideragao explicitamente e, portanto, e capaz de produzir estimadores MELNT. Para 
ver como isso e feito, voltemos ao modelo conhecido de duas variaveis: 

Yi = Pi+ faXi + u t (11.3.1) 

que, para facilitar o calculo algebrico, escrevemos como: 

Yt = faXo, + foX, + Ui (11.3.2) 

em que X Qi - 1 para cada i. O leitor pode ver que essas duas formulagoes sao identicas. 

Agora suponha que as variancias heterocedasticas a\ sejam conhecidas. Dividimos a Equagao 
(11.3.2) por a, para obter 


Yi_ 

Oi 


= Pi 




que, para facilitar a exposigao, escrevemos como: 


* _* * * * * 
Y i = P\ x m + Pi X i + u i 


(11.3.3) 


(11.3.4) 


em que as variaveis com asterisco, ou transformadas, sao as variaveis originais divididas por cr,-. Usa- 
mos a notagao e ft 2 , para indicar os parametros do modelo transformado e distingui-los dos parametros 
normais MQO, /J, e /L. 

Qual o proposito de transformar o modelo original? Para entender isso, note que o aspecto do 
termo de erro transformado u f : 
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(-) 

ja que E(u *) = 0 

\v,J 


yE(u 2 ) 

ja que of e conhecido 

\{ a i) 

ja que E (uf) = of 


(11.3.5) 


que e uma constante. A variancia do termo de erro transformado uf agora e homoscedastica. Uma 
vez que ainda estejamos conservando as outras hipoteses do modelo classico, a constata£ao de que 
u* e homocedastico sugere que, se aplicarmos o MQO ao modelo transformado (11.3.3), ele produ- 
zira estimadores MELNT. Em suma, os ft* e fi% estimados agora sao MELNT e nao os estimadores 
de MQO, (f e f 2 - 

O procedimento de transformar as variaveis originais de forma que as transformadas satisfa 5 am 
as hipoteses do modelo classico e entao aplicar os MQO a elas e conhecido como o metodo de mmi- 
mos quadrados generalizados (MQG). Em smtese, os MQG sao os MQO nas variaveis transformadas 
que satisfazem as hipoteses padrao de mmimos quadrados. Os estimadores assim obtidos sao conhe- 
cidos como estimadores MQG que sao MELNT. 

O mecanismo para estimar f ‘\ e fl f e apresentado a seguir. Primeiro, escrevemos a fun§ao de re- 
gressao amostral (FRA) da Equa 5 ao (11.3.3) 






ou 

V - P\xii + + K 

Agora, para obter os estimadores MQG, minimizamos 


E 


M?* 


- fcxii - kx?) 2 


ou seja, 


E 





(11.3.6) 


(11.3.7) 


O mecanismo real para minimizar a Equa§ao (11.3.7) segue as tecnicas de calculo usadas como padrao 
e e apresentado no Apendice 11 A, Sepao 11A.2. Como mostrado, o estimador de MQG para f>% e 


(E w,-)(E VjXi Yj) - (E ^ Yj) 
(E^HEtf?)- (Em *) 2 


(11.3.8) 


e sua variancia e dada por 


var(/3*) 


_ J2 w i _ 

(E^)(E^-4)- (Ew,i,) 2 


(11.3.9) 


em que w, = l/aj. 
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Diferenga entre os MQO e os MQG 


Lembre-se, do Capftulo 3, que, nos MQO, minimizamos 


2 >? = 


(11.3.10) 


mas nos MQG minimizamos a expressao (11.3.7), que tambem pode ser escrita como 


= J2 W ^ Y ‘ ~ ~ ^ X :) 2 


(11.3.11) 


em que w, = 1/of, (note que a Equanao (11.3.11) e a Equanao (11.3.7) sao identicas). 

Assim, nos MQG minimizamos a soma ponderada dos quadrados dos residuos com w, = 1/of 
funcionando como pesos, mas nos MQO minimizamos uma soma dos quadrados dos residuos (SQR) 
nao ponderada ou (o que resulta no mesmo) igualmente ponderada. Como mostra a Equanao (11.3.7), 
nos MQG o peso atribuido a cada observanao e inversamente proporcional a seu 07 , ou seja, observa¬ 
nces vindas de uma popula§ao com 07 maior obterao peso relativamente menor e aquelas de uma po- 
pulanao com 07 menor terao peso proporcionalmente maior na minimizanao da SQR (11.3.11). Para 
entender a diferen^a entre os MQO e os MQG, observe o diagrama de dispersao hipotetico apresenta- 
do na Figura 11.7. 

Nos MQO (nao ponderados), cada uf associado aos pontos A,BeC recebera o mesmo peso quan- 
do a SQR for minimizada. E claro que, nesse caso, a uf associada ao ponto C dominant a SQR. Mas, 
nos MQG, a observanao extrema C recebera um peso relativamente menor que as outras duas obser¬ 
vances. Como comentado, essa e a estrategia certa, pois ao estimarmos a funnao de regressao popu- 
lacional (FRP) de uma forma mais confiavel, gostariamos de dar mais peso as observances agrupadas 
em torno de sua media (populacional) do que aquelas que estao bastante dispersas. 

Como a Equanao (11.3.11) minimiza uma SQR ponderada, ela e conhecida como mfnimos qua¬ 
drados ponderados (MQP) e os estimadores assim obtidos e apresentados nas Equanoes (11.3.8) e 
(11.3.9) sao conhecidos como estimadores MQP. Mas os MQP sao apenas um caso especial da 
tecnica mais geral de estimanao, os MQG. No contexto da heterocedasticidade, pode-se considerar os 
dois termos MQP e MQG como intercambiaveis. Em capitulos posteriores trataremos de outros casos 
especiais de MQG. 

A proposito, observe que, se vv, = w, uma constante para todo i, /)) e identico a /3 2 e a var (/))) e 
identica a var (/1 2 ) usual (isto e, homoscedastica) dada na Equanao (11.2.3), o que nao deveria surpreen- 
der. (Por que?) (Veja o Exercicio 11.8.) 


FIGURA 11.7 

Diagrama de 
dispersao hipotetico. 
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11.4 Consequencias de usar MQO na presen^a de heterocedasticidade 

Como vimos, /3* 2 e fi 2 sao estimadores (lineares) nao tendenciosos: na amostragem repetida, em 
media, fi% e fi 2 serao iguais ao verdadeiro fi 2 , ou seja, ambos sao estimadores nao tendenciosos. Mas, 
sabemos que jf 2 e eficiente, ou seja, tem a menor variancia. O que acontece com nosso intervalo de 
confianpa, testes de hipoteses e outros procedimentos, se continuarmos a usar o estimador de MQO, 
fi 2 ! Distinguiremos dois casos. 

Estima^ao de MQO admitindo-se a heterocedasticidade 

Suponha que usemos fi 2 e a formula de variancia da Equapao (11.2.2), que considera explicita- 
mente a heterocedasticidade. Usando essa variancia, e supondo que oj seja conhecido, podemos es- 
tabelecer intervalos de confianpa e testar hipoteses com os testes habituais f e F? A resposta, em geral, 
e nao , porque e possfvel mostrar que a varf/f)) < var(J} 2 ), 5 o que significa que os intervalos de con¬ 
fianpa baseados nos ultimos serao desnecessariamente maiores. Como resultado, os testes 1 e Fpro- 
vavelmente nos darao resultados imprecisos, pois a var( fi 2 ) e excessivamente grande e o que parece 
ser tim coeficiente estatisticamente insignificante (porque o valor t e menor que o adequado) pode, de 
fato, ser significativo, se os intervalos corretos de confianpa forem estabelecidos com base no proce- 
dimento MQG. 

Estima^ao de MQO desconsiderando a heterocedasticidade 

A situapao pode tomar-se seria nao so se usarmos f> 2 , mas tambem se continuarmos a usar a for¬ 
mula de variancia da Equapao (11.2.3) diante da presenpa ou suspeita de heterocedasticidade: obser¬ 
ve que esse e o caso mais provavel dos dois discutidos aqui, porque usar o programa padrao de 
calculo de regressoes de MQO e desprezar (ou nao saber da existencia de) a heterocedasticidade for- 
nece a variancia de f J > 2 como na Equapao (11.2.3). Em primeiro lugar, a var (f> 2 ) da Equapao (11.2.3) 
e um estimador tendencioso da var ((i 2 ) dada na Equapao (11.2.2), ou seja, na media ele sobreestima 
ou subestima a variancia, e, em geral, nao podemos dizer se o vies e positivo (sobreestima 5 ao) ou 
negativo (subestima 5 ao), porque depende da natureza da rela 5 ao entre 07 e os valores assumidos pela 
variavel cxplanatoria X, como pode ser observado na Equapao (11.2.2) (veja o Exercicio 11.9). O vies 
surge do fato de que cr, o estimador convencional de er, a saber, /( n ~ 2 ), nao e mais um esti¬ 
mador nao tendencioso deste ultimo quando a heterocedasticidade esta presente (veja o Apendice 
11A.3). Como resultado, nao podemos contar com os intervalos de confianpa calculados da maneira 
convencional e com os testes t e Fempregados normalmente . 6 Em suma, se persistirmos no uso dos 
procedimentos comuns de teste apesar da heterocedasticidade, quaisquer que sejam as conclu- 
s5es a que chegarmos ou as inferencias que fizermos poderao ser equivocadas. 

Para melhor entendermos este assunto, citamos um estudo de Monte Carlo conduzido por 
Davidson e MacKinnon . 7 Eles consideram o seguinte modelo simples, que em nossa notapao e 

Y t = Pi + hX> + u t (11.4.1) 

Eles supoem que (i\= E /E = I e «, ~ N( 0, X"). Como mostra a ultima expressao, os autores supoem 
que a variancia de erro seja heteroscedastica e relacionada ao valor do regressor X com poder a. Se, 
por exemplo, a = 1, a variancia do erro e proporcional ao valor de X\ se a = 2, a variancia do erro e 
proporcional ao quadrado do valor de X e assim por diante. Na Sepao 11.6, iremos considerar a 


5 Uma prova formal pode ser encontrada em DHYRMES, Phoebus J. Introductory econometrics. Nova York: 
Springer-Verlag, 1978. p. 110-111. Observe que a perda da eficiencia de/i 2 (isto e, de quanto a var[S 2 *] excede 
a var[8 2 *] depende dos valores da amostra das variaveis X e do valor de tr, 2 . 

6 Da Equapao (5.3.6) sabemos que o intervalo de confianpa de 100 (1 — a)% para p 2 e [ft ± t a /2 ep (ft)]- Mas, 
se o desvio padrao de ft na° pode ser estimado de uma forma nao tendenciosa, como podemos crer no intervalo 
de confianpa calculado do modo convencional? 

7 DAVIDSON, Russell; MACKINNON, James C. Estimation and inference in econometrics. Nova York: Oxford University 
Press, 1993. p. 549-550. 




380 Parte Dois Relaxamento das hipoteses do modelo classico 


logica que envolve tal procedimento. Com base em 20 mil replicas e permitindo varios valores para 
a, eles obtem os erros padrao dos dois coeficientes de regressao usando os MQO (veja a Equapao 
(11.2.3)), MQO permitindo heterocedasticidade (veja Equaqiao (11.2.2)), e MQG (veja a Equapao 
(11.3.9)). A seguir apresentamos os resultados para valores selecionados de or. 


Erro padrao de ^ Erro padrao de 


Valor de a 

MQO 

MQO h e t 

MQG 

MQO 

MQO h e t 

MQG 

0,5 

0,164 

0,134 

0,110 

0,285 

0,277 

0,243 

1,0 

0,142 

0,101 

0,048 

0,246 

0,247 

0,173 

2,0 

0,116 

0,074 

0,0073 

0,200 

0,220 

0,109 

3,0 

0,100 

0,064 

0,0013 

0,173 

0,206 

0,056 

4,0 

0,089 

0,059 

0,0003 

0,154 

0,195 

0,017 


Nota: MQO het sao MQO levando em conta a heterocedasticidade. 


A caracteristica mais marcante desses resultados e que MQO, com ou sem corregao para hetero¬ 
cedasticidade, consistentemente sobreestima o verdadeiro erro padrao obtido pelo procedimento 
( correto ) dos MQG, principalmente para valores grandes de a, estabelecendo, dessa forma, a supe- 
rioridade dos MQG. Os resultados tambem mostram que, se nao usamos os MQG e confiarmos nos 
MQO — permitindo ou nao a heterocedasticidade —, teremos um quadro confuso. Os erros padrao 
de MQG sao grandes demais (para o intercepto) ou em geral pequenos demais (para o coeficiente 
angular) em relapao aos obtidos pelos MQO, permitindo a heterocedasticidade. A mensagem e clara: 
na presenpa de heterocedasticidade, use os MQG. Contudo, por razoes que explicaremos mais adian- 
te, na pratica nem sempre e facil aplica-los. Tambem, como discutiremos mais frente, se a heteroce¬ 
dasticidade for muito acentuada, nao se pode substituir os MQO por MQG ou por MQP. 

Da discussao anterior, fica claro que a heterocedasticidade e potencialmente um problema grave 
e o pesquisador precisa saber se ela esta presente em determinada situapao. Se ela for detectada, po- 
dem-se adotar medidas corretivas, como a regressao de mmimos quadrados ponderados ou alguma 
outra tecnica. Antes de examinarmos os varios procedimentos corretivos, devemos descobrir se a 
heterocedasticidade esta presente ou se provavelmente ira apresentar-se em algum caso. Esse topico 
e discutido na segao a seguir. 

Uma nota tecnica 

Embora tenhamos afirmado que, em casos de heterocedasticidade, sao os MQG, e nao os MQO, 
que sao MELNT, ha exemplos em que os MQO podem ser MELNT, apesar da heterocedasticidade. * * * * * * 8 
Mas tais exemplos nao sao frequentes na pratica. 


11.5 Detec^ao da heterocedasticidade 

Como acontece com a multicolinearidade, a questao pratica importante e: como saber se a hete¬ 

rocedasticidade esta presente em uma situapao especifica? Novamente, como no caso da multicolinea¬ 

ridade, nao ha regras estabelecidas para detectar a heterocedasticidade, apenas alguns procedimentos. 

Mas essa situaijao e inevitavel, porque so podemos conhecer of se tivermos toda a populaijao Y cor- 

respondente aos A’s selecionados, como a populaijao mostrada na Tabela 2.1 ou na Tabela 11.1. Mas 

tais dados sao uma excepao e nao a regra na maioria das investiga 5 oes economicas. Nesse sentido, os 


8 A razao para isto e que o teorema de Gauss-Markov fornece condifao suficiente (mas nao necessaria) para que 
os MQO sejam eficientes. A condigao necessaria e suficiente para os MQO e dada pelo teorema de Kruskal. 
Mas esse topico esta alem do escopo deste livro. Sou grato a Michael McAleer por chamar minha atenfao para 
esse aspecto. Mais detalhes podem ser encontrados em BARTELS, Michael McAleer. "Proprieties of ordinary least 
squares estimators in regression models with nonspherical disturbances." Joumal of Econometrics, v. 54, n. 1-3, 
p. 321-334, out./dez. 1992, p. 321-334. Para o estudante interessado em matematica, esse topico e discutido 
em mais detalhes no Apendice C, usando algebra matriciai. 
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econometristas diferem dos cientistas que investigam areas como agricultura e biologia, em que os 
pesquisadores tem bastante controle sobre seus dados. Com frequencia, em estudos economicos ha 
apenas um valor amostral Y correspondente a determinado valor de X e nao ha como se conhecer of 
com base em uma unica observa 9 ao de Y. Portanto, na maioria dos casos que envolvem investiga 9 oes 
econometricas, a heterocedasticidade pode ser uma questao de intu^ao, inferences baseadas em in- 
formafoes, experiencia empirica anterior ou pura especula 9 ao. 

Tendo-se em mente essa advertencia, examinemos alguns dos metodos informais e formais para 
detectar a heterocedasticidade. Como a discussao a seguir revelara, a maioria desses metodos baseia- 
-se no exame dos residuos dos MQO, u„ visto que estes e que sao observados, e nao os termos de erro 
iij. Espera-se que sejam boas estimativas de u h o que so podera ser concretizado se o tamanho da 
amostra for muito grande. 


Metodos informais 

Natureza do problema 

Com muita frequencia, a natureza do problema em considera 9 ao sugere a probabilidade de encon- 
trarmos heterocedasticidade. Por exemplo, seguindo o trabalho pioneiro de Prais e Houthaldcer sobre 
estudos de orpamcntos familiares, em que verificaram que a variancia residual em torno da regressao 
de consumo sobre a renda aumentava com a renda, agora se supoe, de modo geral, que em estudos 
semelhantes pode-se esperar variancias desiguais entre os termos de erro. 9 Na verdade, em dados de 
corte transversal envolvendo unidades heterogeneas, a heterocedasticidade pode ser a regra e nao 
a exce?ao. Em uma analise de corte transversal que envolve despesas com investimento em rela- 
9 ao a vendas, taxa de juros etc., em geral espera-se encontrar heterocedasticidade se empresas de 
tamanho pequeno, medio e grande fizerem parte da amostra. 

Na realidade, ja demos exemplos disso. No Capitulo 2 discutimos a rela 9 ao entre salarios medios por 
hora em rela 9 ao a anos de escolaridade nos Estados Unidos. Naquele capitulo tambem discutimos a rela- 
9 ao entre gastos com alimenta 9 ao e despesas totais para 55 familias na India (veja o Exercicio 11.16). 

Metodo grafico 

Se nao ha informa 9 oes a priori ou empmcas sobre a natureza da heterocedasticidade, na pratica pode- 
-se fazer a analise de regressao supondo-se que nao ha heterocedasticidade e entao fazer um exame post 
mortem dos residuos elevados ao quadrado uf para ver se exibem um padrao sistematico. Embora uf nao 
sejam o mesmo que uf, podem ser substitutes um do outro, principalmente se o tamanho da amostra 
for suficientemente grande. 10 Um exame do uf pode revelar padroes como os da Figura 11.8. 

A Figura 11.8 apresenta graficos de uf contra Y h o Y, estimado pela linha de regressao, para des- 
cobrir se o valor medio estimado de Y esta sistematicamente relacionado aos residuos elevados ao 
quadrado. Na Figura 11.8a vemos que nao ha padrao sistematico entre as duas variaveis, o que suge¬ 
re que talvez nao haja heterocedasticidade nos dados. As Figuras 11.8b ate e, no entanto, mostram 
padroes definidos. Por exemplo, a Figura 11.8c sugere uma rela 9 ao linear enquanto as Figuras 11.8c/ 
e e indicam uma rela 9 ao quadratica entre uf e Y h Usando tal conhecimento, embora informal, pode-se 
transformar os dados de modo que, como resultado, nao mostrem heterocedasticidade. Na Se 9 ao 11.6 
examinaremos varias transforma 9 oes como essas. 

Em vez de tra 9 ar o grafico de uf contra Y h pode-se tra 9 a-los contra uma das variaveis explanato- 
rias, principalmente se tra 9 ar uf a Y t resultar no padrao mostrado na Figura 11.8a. Tal representa 9 ao 
grafica, apresentada na Figura 11.9, pode revelar padroes semelhantes aos vistos na Figura 11.8. (No 
caso do modelo de duas variaveis, tra 9 ar o grafico de uf contra Y, equivale a tra 9 a-lo contra X h e, 
portanto, a Figura 11.9 e semelhante a Figura 11.8. Quando consideramos um modelo que envolve 
duas ou mais variaveis X, temos uma situa 9 ao diferente; nesse caso, uf pode ser tra 9 ado contra qual- 
quer variavel X inclulda no modelo.) 


9 PRAIS; S. J.; HOUTHAKKER, H. S. The analysis of family budgets. Nova York: Cambridge University Press, 1955. 

10 Para a relagao entre u, e u veja MALINVAUD, E. Statistical methods of econometrics. Amsterda: North Holland 
Publishing Company, 1970. p. 88-89. 
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FIGURA 11.8 

Padroes hipoteticos de 
resfduos quadraticos 
estimados. 




(c) 



Um padrao como o da Figura 11.9c, por exemplo, sugere que a variancia do termo de erro esta 
relacionada linearmente com a variavel X. Se na regressao das poupan^as contra a renda encontra-se 
um padrao como o da Figura 11.9c, este sugere que a variancia heterocedastica pode ser proporcional 
ao valor da variavel renda. Tal conhecimento pode ajudar a transformar nossos dados de maneira que, 
na regressao com os dados transformados, a variancia do termo de erro seja homocedastica. Voltare- 
mos a tratar do assunto na proxima sec^ao. 


FIGURA 11.9 

Diagrama de 
dispersao dos resfduos 
estimados ao 
quadrado contra X. 






(d) 


(e) 
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Metodos formais 

Teste de Park 11 


Park fonnaliza o metodo grafico sugerindo que of seja uma funfao da variavel explanatoria X r A 
forma funcional sugerida por ele e 



ou 


In cr 2 = In a 2 + /3 InXj + v, 


(11.5.1) 


em que v, e o termo de erro estocastico. 


Uma vez que of em geral nao e conhecido. Park sugere usar uf como proxy e calcular a seguinte 
regressao: 


In uj = In o 2 + /3 In X t + v, 
= a + ft In Xj + vt 


(11.5.2) 


Se ji for significative estatisticamente, isso sugere que a heterocedasticidade esta presente nos dados. Se 
for insignificante, podemos aceitar a hipotese da homocedasticidade. O teste de Park e iim procedimento 
que envolve duas etapas. Na primeira fazemos a regressao de MQO desconsiderando a questao da hetero¬ 
cedasticidade. Obtemos u] dessa regressao, e entao na segunda etapa fazemos a regressao (11.5.2). 

Embora seja interessante do ponto de vista empfrico, o teste de Park apresenta alguns problemas. 
Goldfeld e Quandt alegaram que o termo de erro r, que entra na Equa 5 ao (11.5.2) pode nao satisfazer 
as pressuposi 5 oes dos MQO e ele mesmo pode ser heterocedastico . 12 No entanto, pode-se usar o teste 
de Park como um metodo estritamente exploratorio. 



EXEMPLO 11.1 


ReJagdo entre 
remuneragdo e 
produtividade 


em que Y = remunera^ao media em milhares de dolares, X = produtividade media em mi- 
Ihares de dolares e i = /'-esimo tamanho do emprego de estabelecimento. Os resultados da 
regressao sao os seguintes: 


?i= 1992,3452 + 0,2329X, 
ep= (936,4791) (0,0998) 
t= (2,1275) (2,333) R 2 = 0,4375 


( 11 . 5 . 3 ) 


Os resultados revelam que o coeficiente angular estimado e significante no nfvel de 5%, 
com base no teste t unicaudal. A equa^ao mostra que, quando a produtividade no trabalho 
aumenta em, por exemplo, um dolar, a remuneragao da mao de obra aumenta em media 
23 centavos. 


( Continua ) 


11 PARK, R. E. "Estimation with heterocedastic error terms." Econometrica, v. 34, n. 4, p. 888, out. 1966. O teste 
de Park e um caso especial do teste geral proposto por A. C. HARVEY, A. C. em "Estimating regression models 
with multiplicative Heteroscedasticity." Econometrica, 1976. v. 44, n. 3, p. 461 -465. 

12 GOLDFELD, Stephen M.; QUANDT, Richard E. Nonlinear methods in econometrics. Amsterda: North Holland 
Publishing Company, 1972. p. 93-94. 
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EXEMPLO 11.1 

(' Continuagao ) 


Entao, calcula-se a regressao dos resfduos obtidos na regressao (11.5.3) contra X ; , como 
sugerido na Equa^ao (11.5.2), dando os resultados a seguir: 

IrTof = 35,817 - 2,8099 In X, 

ep= (38,319) (4,216) 

t= (0,934) (-0,667) R 2 = 0,0595 ( 11 . 5 . 4 ) 


Obviamente, nao ha relagao estatisticamente significativa entre as duas variaveis. Seguindo 
o teste de Park, pode-se concluir que nao ha heterocedasticidade na variancia dos erros. 13 


Teste de Glejser 14 

O teste de Glejser tem um espirito semelhante ao de Park. Depois de obter os reslduos da re¬ 
gressao de MQO, Glejser sugere a regressao dos valores absolutos de m, contra a variavel X que se 
considera estreitamente associada a erf. Em seus experimentos, Glejser usa as seguintes formulas 
funcionais: 


| «i| - Pi + foXi + V, 


iii 

lit 


Ui 

Uj 


Pi + PlxfXi + V,- 

1 

Pi + Pi — + Vi 

■X-i 


Pi + Pi J— + Vi 
s/Xi 

\/ P\ + PlX, + Vj 


\lli\ — yj Pi + PlXl + 


em que v, e o termo de erro. 

Novamente, como uma questao pratica ou empirica, pode-se usar a abordagem de Glejser. Mas 
Goldfeld e Quandt ressaltam que o termo de erro v, tem alguns problemas, uma vez que se espera que 
seu valor seja diferente de zero, esteja correlacionado serialmente (veja o Capftulo 12) e, ironicamen- 
te, seja heterocedastico. 15 Uma dificuldade adicional com o metodo de Glejser e que modelos como 

| Mi | = \/Pi + PlX, + Vj 
e 

| M; | = yj Pi + PlX f + Vi 


sao nao lineares nos parametros e, portanto, nao podem ser estimados com o procedimento usual de 
MQO. 

Glejser constatou que, para amostras grandes, os quatro primeiros modelos anteriores em geral apre- 
sentam resultados satisfatorios quanto a detec 9 ao da heterocedasticidade. Como questao pratica, a 
tecnica de Glejser pode ser usada para amostras grandes e, nas pequenas, usa-se estritamente como um 
artiffcio qualitativo, para ter-se uma ideia da heterodasticidade. 


13 A forma funcional escolhida por Park e apenas sugestiva. Uma forma funcional diferente pode revelar relagoes 
significativas. Por exemplo, pode-se usar Of em lugar de In uj como a variavel dependente. 

14 GLEISER, H. "A new test for heterocedasticity." Journal of the American Statistical Association, 1969. v. 64, p. 
316-323. 

15 Para detalhes, veja GOLDFELD e QUANDT, op. cit., cap. 3. 
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EXEMPLO 11.2 

Relagao entre 
remuneragao e 
produtividade: o 
teste de Glejser 


Continuando com o Exemplo 11.1, o valor absoluto dos resfduos obtidos da regressao 
(11.5.3) foram usados no calculo da regressao contra a produtividade media (X), dando os 
seguintes resultados: 


Uj | = 407,2783 - 0,0203X, 

ep= (633,1621) (0,0675) 

t= (0,6432) (-0,3012) 


r 2 = 0,0127 


( 11 . 5 . 5 ) 


Como voce pode ver dessa regressao, nao ha relagao entre o valor absoluto dos resfduos e 
o regressor, a produtividade media. Tal fato reforga a conclusao com base no teste de Park. 


Teste de correla^ao por ordem de Spearman 

No Exercicio 3.8 definimos o coeficiente de correlagao por ordem como 


, = 1 - 



(11.5.6) 


em que d t = diferenpa nas classifica 5 oes atribuidas a duas caracteristicas diferentes do f-esimo indi- 
viduo ou fenomeno e n = numero de individuos ou fenomenos classificados. O coeficiente de correla- 
pao de ordem precedente pode ser usado para detectar a heterocedasticidade como se segue: suponha 

Yi = A) + Pi%i + u i- 


Etapa 1. Ajuste a regressao aos dados em Eele obtenha os resfduos 

Etapa 2. Ignorando o sinal de u h ou seja, tomando o seu valor absoluto I u,\, ordene tanto I ii, I 
quanto X, (ou V,) de acordo com uma ordem ascendente ou descendente e calcule o coeficiente 
de correla^ao pela ordem apresentada anteriormente; 

Etapa 3. Supondo que o coeficiente de correlapao por ordem da populapao p s seja zero e n > 8, 
a significance de r s na amostra pode ser verificada pelo teste t como a seguir: 16 


= r sy /n - 2 

V 1 - r I 


(11.5.7) 


com graus de liberdade iguais a n — 2. 

Se o valor t calculado excede o valor critico t, podemos aceitar a hipotese da heterocedasticidade; 
caso contrario, rejeitamos. Se o modelo de regressao envolver mais de uma variavel X, r s podera ser 
calculado entre I u t \ e cada uma das variaveis X separadamente e podera ser testado quanto a signi¬ 
ficance estatistica pelo teste t da Equa^'ao (11.5.7). 


EXEMPLO 11.3 Para ilustrar o teste de correlafao por ordem, considere os dados da Tabela 11.2. Eles 
llustragdo do pertencem ao retorno anual medio (£, %) e ao desvio padrao do retorno anual ( 07 , %) de 10 

teste de fundos md tuos. 

correlagdo por 
ordem 

( Continua ) 


16 


Veja YULE, G. Udny; KENDALL, M. G. An introduction to the theory of statistics. Londres: Charles Criffin & 
Company, 1953. p. 455. 
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EXEMPLO 11.3 

(' Continuagao ) 


TABELA 11.2 Teste de correla^ao por ordem para a heterocedasticidade 



Ei, 

Oi, 





d, 



Retorno 

Desvio 





Diferen^a 



anual 

padrao 


1 up 



entre as 


Nome do fundo mutuo 

medio, 

do retorno 


Resfduos, 

Ordem 

Ordem 

duas 



% 

anual, % 

E* 

1 (Ei - E) | 

de | £#/| 

de a; 

classifica^des d 2 

Boston Fund 

12,4 

12,1 

11,37 

1,03 

9 

4 

5 

25 

Delaware Fund 

14,4 

21,4 

15,64 

1,24 

10 

9 

1 

1 

Equity Fund 

14,6 

18,7 

14,40 

0,20 

4 

7 

-3 

9 

Fundamental Investors 

16,0 

21,7 

15,78 

0,22 

5 

10 

-5 

25 

Investors Mutual 

11,3 

12,5 

11,56 

0,26 

6 

5 

1 

1 

Loomis-Sales Mutual Fund 

10,0 

10,4 

10,59 

0,59 

7 

2 

5 

25 

Massachusetts Investors Trust 

16,2 

20,8 

15,37 

0,83 

8 

8 

0 

0 

New England Fund 

10,4 

10,2 

10,50 

0,10 

3 

1 

2 

4 

Putnam Fund of Boston 

13,1 

16,0 

13,16 

0,06 

2 

6 

-4 

16 

Wellington Fund 

11,3 

12,0 

11,33 

0,03 

1 

3 

-2 

4 

Total 







0 

110 


*Obtido da regressao: E, = 5,8194 + 0,4590 07 . 
t Valor absoluto dos resfduos. 

Nota: classifica^ao por ordem ascendente de valores. 


A linha de mercado de capitals da teoria do portfolio postula uma relagao linear entre o re- 
torno esperado (£,) e o risco (medido pelo desvio padrao, a) de um portfolio: 


Ei = Pi + P2 


Usando os dados na Tabela 11.2, o modelo anterior foi estimado e seus resfduos, calculados. 
Uma vez que os dados sao referentes a 10 fundos mutuos de tamanhos e objetivos de inves- 
timento diferentes, a priori pode-se esperar heterodasticidade. Para verificarmos essa hipote- 
se, aplicamos o teste de correlafao por ordem. Os calculos necessarios estao na Tabela 11.2. 
Aplicando a formula (11.5.6), obtemos 


rs 1 6 10(100 - 1 ) 
= 0,3333 


( 11 . 5 . 8 ) 


Aplicando o teste dado na Equa^ao (11.5.7), obtemos 

t= (0.3333X78) 
71-0.1110 
= 0,9998 


( 11 . 5 . 9 ) 


Para os 8 graus de liberdade, esse valor t nao e significativo nem mesmo ao nfvel de signifi¬ 
cance de 10%; o p-valor e 0,1 7. Nao ha evidencia de uma relafao sistematica entre a variavel 
explanatoria e os valores absolutos dos resfduos, o que poderia sugerir que nao ha heteroce¬ 
dasticidade. 


Teste de Goldfeld-Quandt 17 

Este metodo popular e aplicavel quando se supoe que a variancia heterocedastica, of, relaciona-se 
positivamente com uma das variaveis explanatorias no modelo de regressao. Para simplificarmos, 
consideramos o modelo usual de duas variaveis: 

Y, = P\ + Xi + u i 


17 COLDFELD e QUANDT, op. cit., cap. 3. 
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Suponha que of relacione-se positivamente a X ; como 

cr?=cr 2 Xj (11.5.10) 

em que cr e uma constante. 18 

A hipotese (11.5.10) postula que of e proporcional ao quadrado da variavel X. Tal hipotese foi 
considerada muito util por Prais e Houthakker, no estudo sobre orgamentos de famflias. (Veja na 
Segao 11.5 o topico Metodos informais.) 

Se a Equagao (11.5.10) for adequada, significa que of sera maior quanto maiores forem os valores 
de X- r Se este for o caso, a heterodasticidade muito provavelmente estara presente no modelo. Para 
teste, Goldfeld e Quandt sugerem as seguintes etapas: 

Etapa 1. Ordene ou classifique as observagoes de acordo com os valores de A ; , a comegar pelo 
valor mais baixo de X. 

Etapa 2. Omita c observagoes centrais, em que c e especificado a priori, e divida as observagoes 
remanescentes em dois grupos com observagoes (n — c)/2 em cada um. 

Etapa 3. Ajuste as regressoes MQO separadas, para as primeiras observagoes in — c)/2 e para as 
ultimas (n — c)/2, e obtenha as respectivas somas dos quadrados dos residuos, SQR, e SQR 2 , em 
que SQR! representa a soma dos quadrados dos residuos a partir da regressao correspondente aos 
valores menores de A, (o grapo de pequena variancia) e SQR 2 a partir do conjunto com maiores 
valores de A, (o grupo com variancia maior). Essas somas tem, cada uma 

graus de liberdade 

em que keo numero de parametros a serem estimados, incluindo o intercepto. (Por que?) Para o 
caso de duas variaveis, evidentemente k e igual a 2. 


(n ~ c ) 


- k 


ou 


n - c - 2k 


Etapa 4. Calcule a razao 

X = SQR2/gl (11.5.11) 

SQRi/gl 

Se pressupormos que os u ,■ sejam distribuidos normalmente (o que em geral acontece), e se a 
hipotese da homocedasticidade for vdlida, entao poderemos mostrar que k da Equagao (11.5.10) 
segue a distribuigao F, tendo o numerador e o denominador in — c — 2k)/2 graus de liberdade. 


Se, em uma aplicagao, k (= F) calculado for maior que o F critico ao nivel de significancia esco- 
lhido, poderemos rejeitar a hipotese da homocedasticidade poderemos dizer que a heterocedasticida¬ 
de e muito provavel. 

Antes de apresentarmos uma ilustragao do teste, examinemos a omissao das c observagoes 
centrais. Essas observagoes sao omitidas para ressaltar ou acentuar a diferenga entre o grupo com 
variancias pequenas (SQR!) e o de grandes variancias (SQR 2 ). Mas o sucesso dos resultados obtidos 
com o teste Goldfeld-Quandt dependera de como c e escolhido. 19 Para o modelo de duas variaveis, 
os experimentos de Monte Carlo feitos por Goldfeld e Quandt sugerem que c seja cerca de 8, se o 
tamanho da amostra for de aproximadamente 30, e que seja cerca de 16, se o tamanho aproximado 
for de 60. Mas Judge et al observam que c = 4, se n = 30, e c - 10, se n for cerca de 60, sao valores 
satisfatorios na pratica. 20 


18 Esta e apenas uma pressuposigao plausfvel. Na realidade, exige-se que cr , 2 esteja monotonicamente relacionada a X ; . 

19 Tecnicamente, a potencia do teste depende de como ce escolhido. Em estatfstica, a potencia de um teste e 
medida pela probabilidade de rejeitar a hipotese nula quando ela e falsa (isto e, por 1 - Prob [erro de tipo II]). 
Aqui a hipotese nula e que as variancias dos dois grupos sao as mesmas, ou seja, homocedasticidade. Para 
outras discussoes, veja ALI, M. M.; GIACCOTTO, C. "A study of several new and existing tests for heteroscedas- 
ticity in the general linear model." journal of Econometrics, 1984. v. 26, p. 335-373. 

20 JUDGE, George G.; HILL, R. Carter; GRIFFITHS, William E.; LUKEPOHL, Helmut; LEE, Tsoyng-Chao. Introduction 
to the theory and practice of econometrics. Nova York: John Wiley & Sons, 1982. p. 422. 
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EXEMPLO 11.4 

Teste de 

Goldfeld-Quandt 


TABELA 11.3 

Dados hipoteticos 
sobre gastos de 
consumo F($) e 
renda A($) para 
ilustrar o teste de 
Goldfeld-Quandt 


Antes de prosseguirmos, podemos notar que, quando ha mais de uma variavel X no modelo, a 
classificafao das observances, o primeiro passo do teste, pode ser feito de acordo com qualquer 
uma delas. Assim, no modelo: Y t = fi\ + ft 2 ^ 2 ,+ fS^X^ + /f 4 A 4 , + u h podemos ordenar os dados 
de acordo com qualquer um desses X. Se a priori nao estamos certos de qual variavel X e adequada, 
podemos conduzir o teste para cada uma das variaveis X, ou por meio do teste de Park, para 
cada X. 


Para ilustrar o teste de Goldfeld-Quandt, apresentamos na Tabela 11.3 dados sobre gas¬ 
tos de consumo em relafao a renda para um corte transversal de 30 famflias. Supoe-se que 
postulamos que os gastos de consumo tenham uma relagao de linearidade com a renda, 
mas que a heterocedasticidade esteja presente nos dados. Postulamos ainda que a natureza 
da heterocedasticidade seja aquela dada na Equa^ao (11.5.10). O reordenamento necessa- 
rio dos dados para a aplicafao do teste tambem esta presente na Tabela 11.3. 

Eliminando as 4 observances do meio, as regressoes de MQO para as 1 3 primeiras e para 
as 1 3 ultimas observances e suas somas dos quadrados dos resfduos associadas sao mostradas 
a seguir (erros padrao entre parenteses). 


Dados ordenados por 
valores de X 


Y 

X 

Y 

X 

55 

80 

55 

80 

65 

100 

70 

85 

70 

85 

75 

90 

80 

110 

65 

100 

79 

120 

74 

105 

84 

115 

80 

110 

98 

130 

84 

115 

95 

140 

79 

120 

90 

125 

90 

125 

75 

90 

98 

130 

74 

105 

95 

140 

110 

160 

108 

145 

113 

150 

113 

150 

125 

165 

no 

160 

108 

145 

125 

165 

115 

180 

115 

180 

140 

225 

130 

185 

120 

200 

135 

190 

145 

240 

120 

200 

130 

185 

140 

205 

152 

220 

144 

210 

144 

210 

152 

220 

175 

245 

140 

225 

180 

260 

137 

230 

135 

190 

145 

240 

140 

205 

175 

245 

178 

265 

189 

250 

191 

270 

180 

260 

137 

230 

178 

265 

189 

250 

191 

270 


4 observances 
do meio 


( Continua ) 
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EXEMPLO 11.4 

( Continuagao ) 


Regressao baseada nas 1 3 primeiras observagoes: 

Yj = 3,4094 + 0,6968X, 

(8,7049) (0,0744) r 2 = 0,8887 SQRi= 377,17 gl = 11 

Regressao baseada nas 1 3 ultimas observadas: 

Yi=- 28,0272 + 0,7941 X, 

(30,6421) (0,1319) r 2 = 0,7681 SQR 2 = 1536,8 gl = 11 

Desses resultados, obtemos 
SQR 2 /gl _ 1536,8/gl 
_ SQRi/gl ~ 377.1 7/gl 
X = 4,07 


O valor critico de Fpara 11 graus de liberdade no numerador e no denominador no nfvel de 
5% e 2,82. Uma vez que of(=A) estimado excede o valor critico, podemos concluir que ha 
heterocedasticidade na variancia de erro. Entretanto, se o nivel de significance forfixado em 
1%, nao podemos rejeitar a suposigao de homocedasticidade. (Por que?) Note que o p valor 
do X observado e 0,014. 


Teste de Breusch-Pagan-Godfrey 21 

O sucesso do teste de Goldfeld-Quandt depende nao so do valor de c (o numero de observances 
centrais omitidas), mas tambem de identificar a variavel X correta com a qual se colocam as observa¬ 
nces em ordem. Essa limitagao do teste pode ser evitada se considerarmos o teste de Breusch-Pagan- 
-Godfrey (BPG). 

Para ilustra-lo, considere um modelo de regressao linear com k variaveis explicativas 

Yt = Pi + p 2 X 2i + • • • + PkX ki + Ui (11.5.12) 

Suponha que a variancia do erro of seja descrita como 

a i = /(“l + “2^2i + "■ + OlmZmi ) (11.5.13) 

ou seja, of e uma fungao das variaveis nao estocasticas Z; alguns ou todos os X!v podem servir como 
Z’s. Especificamente, suponha que 

erf - a\ + a 2 Z 2i + •••+ a m Z rni (11.5.14) 

ou seja, of e uma fun 5 ao linear dos Z. Se a 2 = — ... = a m = 0, erf = a h que e uma constante. Por- 

tanto, para testarmos se of e homocedastico, podemos testar ahipotese de que of 2 = = ... = a m = 0 . 

Essa e a ideia basica do teste de Breusch-Pagan-Godfrey. Segue o procedimento para o teste: 

Etapa 1. Calcule a Pquapao (11.5.12) por MQO e obtenha osresiduos u h u 2 ,, u„. 

Etapa 2. Obtenha d 2 = J2 l ~ l f / n - Lembre-se, do Capltulo 4, que este e o estimador de maxima 
verossimilhan 5 a (MV) de er 2 . (Nota: o estimador de MQO e Yf, uf/[n - &].) 

Etapa 3. Construa variaveis /?, definidas como: 

Pi = M, / or 

que sao simplesmente cada residuo elevado ao quadrado dividido por d 2 . 

Etapa 4. Fa 5 a a regressao de p, assim construida sobre os Z’s como 

Pi = oil + oi 2 Z 2i +-f a m Z m i + v t (11.5.15) 

em que v ; - e o termo residual dessa regressao; 


BREUSCH, T.; PAGAN, A. "A simple test for heteroscedasticidade and random coefficient variation." Econometrica, 
1979. v. 47, p. 1.287-1.294. Veja tambem GODFREY, L. "Testing for multiplicative heteroscedasticity." Journal 
of Econometrics, v. 8, p. 227-236, 1978. Devido a similaridade, esses testes sao conhecidos como testes de 
Breusch-Pagan-Godfrey para heterocedasticidade. 


21 






390 


Parte Dois Relaxamento das hipoteses do modelo classico 


Etapa 5. Obtenha SQE (soma dos quadrados explicados) da Equac^ao (11.5.15) e defina 


© = ^(SQE) 


(11.5.16) 


Supondo que os u, sejam normalmente distribuldos, pode-se mostrar que se ha homocedasticida- 
de e se o tamanho da amostra n aumenta indefinidamente, entao 


(11.5.17) 

ou seja, © segue a distribu^ao de qui-quadrado com (m — 1) graus de liberdade. ( Nota : ass 
significa assintoticamente). 

Portanto, se em uma aplica§ao o 0 (= x 2 ) calculado for maior que o valor crftico y 2 no nfvel 
escolhido de significancia, poderemos rejeitar a hipotese de homocedasticidade; caso contrario, 
esta nao sera rejeitada. 


O leitor pode desejar saber por que BPG (Breusch-Pagan-Godfrey) escolheu Vi SQE como a es- 
tatistica de teste. A logica e ligeiramente complexa, sendo deixada para as referencias. 22 


EXEMPLO 11.5 

Teste de Breusch- 
Pagan-Godfrey 
(BPG) 


Como exemplo, retomemos os dados (Tabela 11.3) usados para ilustrar o teste de hetero- 
cedasticidade de Godfeld-Quandt. Fazendo a regressao de Y contra X, obtemos o seguinte: 

Etapa 1. 

Yi = 9,2903 + 0,63 78X, 

ep= (5,2314) (0,0286) SQR = 2361,153 R 2 = 0,9466 


Etapa 2. 


6 2 = ^]u, 2 /30 = 2361,153/30 = 78,7051 


Etapa 3. Divida os resfduos elevados ao quadrado u, obtidos da regressao (11.5.18) por 
78,7051 para construir a variavel p,. 

Etapa 4. Supondo que os p, sejam linearmente relacionados a X, (= Z,) como na Equa^ao 
(11.5.14), obtemos a regressao 

Pi =- 0,7426 + 0,0101X, 

ep= (0,7529) (0,0041) SQE = 10,4280 R 2 =0,18 (11.5.19) 

Etapa 5. 

0= ^(SQE)= 5,2140 (11.5.20) 


Sob os pressupostos do teste BPG, ©, na Equagao (11.5.20), segue assintoticamente a distribui- 
g:ao qui-quadrado com 1 grau de liberdade. (Nota: Ha apenas um regressor na Equa^ao 
(11.5.19). Agora, da tabela do qui-quadrado, verificamos que, para 1 grau de liberdade, o valor 
crftico de qui-quadrado a 5% e 3,8414 e o valor de / 2 a 1% e de 6,6349. Dessa forma, o 
valor observado do qui-quadrado de 5,2140 e significativo ao nfvel de 5%, mas nao ao nfvel de 
1 %. Portanto, chegamos a mesma conclusao que o teste de Goldfeld-Quandt. Mas lembre-se 
de que, falando estritamente, o teste BPG e assintotico, de grandes amostras e, no exemplo em 
questao, 30 observances podem nao constituir uma amostra grande. Tambem e preciso ressal- 
tar que em amostras pequenas o teste e sensfvel a hipotese de que erros u, sejam normalmente 
distribuldos. Evidentemente, podemos testar o pressuposto de normalidade aplicando os 
testes discutidos no Capftulo 5. 23 


22 Veja DARNELL, Adrian C. A dictionary of econometrics. Cheltenham, U.K.: Edward Elgar, 1994. p. 1 78-179. 

23 Sobre o assunto, veja KOENKER, R. "A note on studentizing a test for heteroscedasticity." ]ournal of Econometrics, 
1981. v. 17, p. 1.180-1.200. 
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Teste geral de heterocedasticidade de White 

Ao contrario do teste de Goldfeld-Quandt, que requer a reordcnagao das observa 9 oes com respeito a 
variavel X que supostamente causa heterocedasticidade, ou o teste de BPG, que e sensivel a hipotese da 
normalidade, o teste geral da heterocedasticidade proposto por White nao requer a hipotese da normali- 
dade e e facilmente implementado . 24 Para ilustrar a ideia, considere o modelo de regressao a seguir, com 
tres variaveis (a generaliza 9 ao para o modelo com k variaveis e direta): 

Yi = P l + PiXii + PiXii + Uj (11.5.21) 

Para realizar o teste de White, procede-se da seguinte forma: 

Etapa 1. Com os dados, calculamos a Equa 9 ao (11.5.21) e obtemos os residuos, u L . 

Etapa 2. Entao, fazemos a seguinte regressao (auxiliar): 

u] = oq + 0 : 2 X 2 , + 0 : 3 X 3 , + 0 : 4 X 2 , + 0 : 5 X 3 , + a^XiiXsi + v,- (11.5.22) 25 

Ou seja, os residuos ao quadrado da regressao original sao calculados por regressao contra as 
variaveis ou regressores X originais, seus valores elevados ao quadrado e os produtos cruzados 
dos regressores. Tambem podem ser incluidos regressores com expoentes mais altos. Observe 
que ha um terrno constante nessa equa 9 ao, embora a regressao original possa ou nao conte-lo. 
Obtenha o R 2 dessa regressao (auxiliar). 

Etapa 3. Sob a hipotese nula de que nao ha heterocedasticidade, pode-se mostrar que o tamanho 
da amostra (n) multiplicado pelo R 1 da regressao auxiliar segue assintoticamente a distribu^ao 
de qui-quadrado com graus de liberdade iguais ao numero de regressores (excluindo-se o termo 
constante) na regressao auxiliar. Isto e, 

n ■ R 2 ~ Xgi (11.5.23) 

ass 6 

em que os graus de liberdade sao definidos como anteriormente. Em nosso exemplo, ha 5 graus 
de liberdade uma vez que ha 5 regressores na regressao auxiliar. 

Etapa 4. Se o valor do qui-quadrado obtido na Equa 9 ao (11.5.23) excede o valor critico do qui- 
-quadrado ao nivel escolhido de significance, a conclusao e de que ha heterocedasticidade. 
Se ele nao exceder o valor critico do qui-quadrado, nao havera heterocedasticidade, indicando 
que, na regressao auxiliar (11.5.22), a 2 - = « 4 = a 5 = ay, = () (veja a nota de rodape 25). 


EXEMPLO 11.6 

Teste de 
heteroce¬ 
dasticidade 
de White 


Com os dados do corte transversal de 41 pafses, Stephen Lewis estimou o modelo de re¬ 
gressao a seguir: 26 


In Y, = fa + p 2 In X 2 , + hi In X 3 , + u, (i i .5.24) 

em que Y = valor proporcional dos impostos (de importafao e exportagao) no total da receita 
do governo, X 2 = valor proporcional da soma de exportagoes mais importa 9 oes relativas ao PIB, 
e X 3 = PIB per capita; e In representa o logaritmo natural. Sua hipotese foi de que Ye X 2 estariam 
positivamente correlacionados (quanto mais alto o volume de transagoes comerciais, mais alta 
a receita tributaria gerada) e que leX 3 estariam negativamente relacionadas (quando a renda 
aumenta, o governo acha mais facil cobrar impostos diretos — por exemplo, imposto de 
renda — do que contar com impostos incidentes sobre transagoes comerciais). 

( Continua ) 


24 WHITE, H. "A heteroscedasticity consistent covariance matrix estimator and a direct test of heteroscedasticity." 
Ecorometrica, 1980. v. 48, p. 81 7-818. 

25 Implfcita neste procedimento esta a hipotese de que a variancia do erro de u,, ofesta funcionalmente relaciona- 
da a regressores, seus quadrados e seus produtos cruzados. Se todos os coeficientes angulares parciais nessa re¬ 
gressao sao simultaneamente iguais a zero, entao a variancia do erro e a constante de homocedasticidade igual a,. 

26 LEWIS, Stephen R. "Government revenue from foreign trade." Manchester School of Economics and Social Studies, 
1963. v. 31, p. 39-47. 
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EXEMPLO 11.6 

(' Continuagdo ) 


Os resultados empfricos corrobararam as hipoteses. Para nossos fins, o importante e se ha 
heterocedasticidade nos dados. Uma vez que os dados provem de corte transversal envolven- 
do pafses heterogeneos, a priori se esperaria heterocedasticidade na variancia dos erros. Ao 
aplicar o teste de heterocedasticidade de White aos resfduos obtidos da regressao (11.5.24), 
foram obtidos os seguintes resultados: 27 


uf = - 5,841 7 + 2,5629 In Trade, + 0,6918 In PIB, 

- 0,4081 (In Trade/) 2 - 0,0491 (In PIB,) 2 ( 11 .5.25) 

+ 0,0015(ln Trade/)(ln PIB/) R 2 = 0,1148 


Nota: os erros padrao nao sao apresentados, pois nao sao pertinentes para nossos fins. 
Agora n ■ R 2 = 41 (0,1148) = 4,7068 tem, assintoticamente, uma distribuifao quiquadrado 
com 5 graus de liberdade (por que?). O valor critico de 5% graus de liberdade para o qui- 
-quadrado e nfvel de significance de 5% e de 11,0705 e com significance de 10% e de 
9,2363 e com 25% e de 6,62568. Para fins praticos, podemos concluir, com base no teste de 
White, que nao ha heterocedasticidade. 


Vale fazer um comentario sobre o teste de White. Se um modelo tem varios regressores, introduzir 
todos os regressores, seus termos ao quadrado (ou a potencias mais elevadas) e seus pontos cruzados 
pode consumir rapidamente os graus de liberdade. Portanto, deve-se ter cautela para usar o teste. 28 

Em casos em que o teste estatistico de White apresentado em (11.5.25) e estatisticamente signifi- 
cante, a heterocedasticidade pode nao ser necessariamente a causa, mas os erros de especificacjao, 
sobre os quais discorreremos mais detalhadamente no Capitulo 13 (veja o item 5 da Sec^ao 11.1). Em 
outras palavras, o teste de White pode ser um teste de heterocedasticidade (pura) ou de erro de 
especifica^ao ou ambos. Ja afirmamos que, se nao houver termos de produtos cruzados, ele sera um 
teste de heterocedasticidade pura. Se tais termos estao presentes, trata-se de um teste tanto de hetero- 
cedastocidade quanto de vies de especificac^ao. 29 

Outros testes de heterocedasticidade 

Ha varios outros testes de heterocedasticidade, cada qual baseado em certas hipoteses. O leitor in- 
teressado podera desejar consultar as referencias. 30 Mencionamos apenas um desses testes, devido a 
sua simplicidade. E o teste de Koenker-Bassett (KB). Como os testes de Park, de Breusch-Pagan- 
-Godfrey e de White, o teste KB baseia-se nos residuos elevados ao quadrado, uf, mas, em vez de se 
fazer a regressao com um ou mais regressores, os resfduos elevados ao quadrado sao regredidos contra 
os valores estimados do regressando elevados ao quadrado. Especificamente, se o modelo original e: 

Yi = Pi + ^ 2 X 21 + PiXn + ■ • • + faX ki + Uj (11.5.26) 

estimamos esse modelo, obtemos os M, e entao estimamos 

uf = a, + a z (Yi) 2 + Vi (11.5.27) 


27 Estes resultados, com a mudanfa na notagao, sao reproduzidos de LOTT, William F.; RAY, Subhash C. Applied 
econometrics: problems with data sets. Instructor's Manual, cap. 22, p. 137-140. 

28 As vezes o teste pode ser modificado para conservar graus de liberdade. Veja o Exerdcio 11.18. 

29 Veja HARRIS, Richard. Using cointegration analysis in econometrics modelling. Reino Unido: Prentice Hall & Harvester 
Wheatsheaf, 1995. p. 68. 

30 Veja HARRISON, M. J.; MCCABE, B. P. "A test for heteroscedasticity based on ordinary least squares Residuals." 
Journal of the American Statistical Association, v. 74, p. 494-499. SZROETER, J. "A class of parametric tests for 
heteroscedasticity in linear econometric models." Econometrica, v. 46, p. 1.311-1.327, 1978. EVANS, M. A.; 
KING, M. L. "A further class of tests for heteroscedasticity." Journal of Econometrics, v. 37, p. 265-276, 1988. 
KOENLER R.; BASSETT, G. "Robust tests for heteroscedastividy based on regression quantiles." Econometrica, 
1982. v. 50, p. 43-61. 
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em que Y, sao os valores estimados do modelo (11.5.26). A hipotese nula e de que u 2 = 0. Se esta nao 
for rejeitada, entao se poderia concluir que nao ha heterocedasticidade. A hipotese nula pode ser tes- 
tada pelo teste usual t ou pelo teste F. (Note que F lk = t k 2 .) Se o modelo (11.5.26) for log-log, faz-se a 
regressao de (log Y,) 2 contra os quadrados dos reslduos. Outra vantagem do teste de KB e que ele e 
aplicavel mesmo quando o termo de erro no modelo original (11.5.26) nao e distribuldo normalmente. 
Se aplicarmos o teste de KB ao Exemplo 11.1, veremos que o coeficiente angular da regressao dos 
quadrados dos reslduos obtidos na Equa£ao (11.5.3) sobre o Yj estimado da Equagao (11.5.3) nao 
difere estatisticamente de zero, reforcando, assim, o teste de Park. Esse resultado nao deveria sur- 
preender, uma vez que no caso so temos um regressor. Mas o teste de KB e aplicavel com um ou 
mais regressores. 

Uma observagdo a respeito dos testes de heterocedasticidade 

Discutimos varios testes de heterocedasticidade nesta se§ao. De que maneira decidimos qual e o 
melhor? Esta nao e uma questao facil, pois esses testes baseiam-se em varios pressupostos. Ao com- 
pararmos os testes, precisamos prestar atenpao ao seu tamanho (ou nivel de significancia), potencia 
(a probabilidade de rejeitar uma hipotese falsa) e a sensibilidade a discrepancias (outliers). 

Ja apontamos algumas das limitapoes do teste de White para heterocedasticidade, que e facil de 
aplicar. Em decorrencia dessas limitapoes, pode-se ter uma baixa potencia contra as alternativas. Alem 
disso, o teste ajuda pouco na identificapao dos fatores ou variaveis que causam heterocedasticidade. 

Da mesma forma, o teste de Breusch-Pagan-Godfrey e sensivel a hipotese da nomialidade. Em contra- 
partida, o de Koenker-Bassett nao conta com a hipotese da normalidade e pode, portanto, ser mais potente. 31 
No teste de Goldfeld-Quandt, se omitimos muitas observapbes, podemos diminuir sua performance. 

Apresentar analise comparativa dos varios testes de heterocedasticidade e algo que vai alem do 
escopo deste livro. Mas o leitor interessado pode consultar o artigo de John Lyon e Chin-Ling Tsai 
para ter ideia dos pontos fortes e fracos de varios testes de heterocedasticidade. 32 


11.6 Medidas corretivas 

Como vimos, a heterocedasticidade nao destroi as propriedades de nao tendenciosidade e consis- 
tencia dos estimadores de MQO, mas eles deixam de ser eficientes, mesmo assintoticamente (em 
grandes amostras). A falta de eficiencia torna duvidoso o valor dos procedimentos usuais de teste de 
hipoteses. Portanto, medidas corretivas podem ser necessarias. Ha duas abordagens para a correfao: 
quando a\ e conhecido e quando nao e conhecido. 

Quando crj e conhecido: o metodo de rmnimos quadrados ponderados 

Como vimos na se 5 ao 11.3, se of e conhecido, o metodo mais pratico para corrigir heterocedasti¬ 
cidade e por meio dos mlnimos quadrados ponderados, pois os estimadores obtidos sao MELNT. 


EXEMPLO 11.7 

Ilustragao do 
metodo de 
mmimos 
quadrados 
ponderados 


Para ilustrarmos o metodo, suponha que desejemos estudar a relagao entre remuneragao 
e o numero de funcionarios para os dados apresentados na Tabela 11.1. Para simplificarmos, 
medimos o numero de funcionarios por 1 (1-4 funcionarios), 2 (5-9 funcionarios), ..., 9 
(1.000-2.499 funcionarios), embora tambem pudessemos medi-lo pelo ponto medio das 
varias classes apresentadas no quadro. 


(Continua) 


31 Para detalhes, veja GREEN, William H. Econometric analysis. 6. ed. Nova Jersey: Pearson/Prentice-Hall, 2008. 
p. 165-167. 

32 Veja o artigo deles, "A comparison of tests of heteroscedasticity." The Statician, 1996. v. 45, n. 3, p. 337-349. 
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EXEMPLO 11.7 

(' Continuagdo ) 


Agora, representando a remunera^ao media por funcionario, em $, por Yeo numero de 
funcionarios por X, calculamos a regressao conforme mostra a 


Yi/ffi = ^*0/07)+ p ' 2 (Xi/cri)+ ( Ui/CTj ) 


( 11 . 6 . 1 ) 


em que cr, e o desvio padrao da remuneragao, conforme mostrado na Tabela 11.1. Os dados 
necessarios para avaliar esta regressao sao fornecidos na Tabela 11.4. 


TABELA 11.4 

Ilustrafao de uma 
regressao de 
mfnimos 
quadrados 
ponderados 

Fonte: os dados de Y e o ( 
(desvio padrao da 
remuneragao) sao da 
Tabela 11.1. Numero de 
funcionarios: 1 = 1 a 4; 
2 = 5 a 9 etc. Esses 
dados tambem foram 
extraidos da Tabela 
11 . 1 . 


Recomunicafao, Numero de funcionarios, 


Y 

X 

o; 

Yi/Oi 

Xjoi 

3.396 

1 

742,2 

4,5664 

0,0013 

3.787 

2 

851,4 

4,4480 

0,0023 

4.013 

3 

727,8 

5,5139 

0,0041 

4.104 

4 

805,06 

5,0978 

0,0050 

4.146 

5 

929,9 

4,4585 

0,0054 

4.241 

6 

1.080,6 

3,9247 

0,0055 

4.387 

7 

1.241,2 

3,5288 

0,0056 

4.538 

8 

1.307,7 

3,4702 

0,0061 

4.843 

9 

1.110,7 

4,3532 

0,0081 


Nota: na regressao (11.6.2), a variavel dependente e (1 //<t,-) e as variaveis independentes sao (I/ 07 ) e (X// 07 ) 


Antes de passar para os resultados da regressao, note que a Equagao (11.6.1) nao possui 
termo de intercepto. (Por que?) Teremos de usar o modelo de regressao que passa pela ori- 
gem para estimar fi\ e assunto discutido no Capltulo 6. Mas a maioria dos programas de 
computador atuais tern uma op^ao para suprimir o termo de intercepto (como ocorre com o 
Minitab ou o EViews). Vale ressaltar outro aspecto importante da Equa^ao (11.6.1): ela tern duas 
variaveis explanatorias (1 /cr ( ) e (X,/cr ; ), enquanto, se tivessemos de usar os MQO, o calculo de re¬ 
gressao da remunera^ao contra o numero de funcionarios teria uma unica variavel explanatory, 
X/. (Por que?) 

Os resultados de regressao com MQP sao os seguintes: 


(Yj/ai) = 3406,639(1/a,)+ 1 54,153(X,/cr,) 

(80,983) (16,959) 

t = (42,066) (9,090) 

R 2 = 0,9993 33 

Por comparafao, damos os resultados usuais ou nao ponderados de MQO: 


( 11 . 6 . 2 ) 


Yj = 3417,833 + 148,767 X, 

(81,136) (14,418) 

t= (42,125) (10,318) R 2 = 0,9383 

No Exercfcio 11.7, pede-se para comparar essas duas regressoes. 


Quando erf nao e conhecido 

Como notado anteriormente, se os verdadeiros a 2 forem conhecidos, poderemos empregar o me- 
todo dos MQP para obter estimadores MELNT. Uma vez que os verdadeiros of raramente sao conhe- 


33 De acordo com a nota de rodape 3 do Capftulo 6, a regressao de R 2 atraves da origem nao e diretamente 
comparavel com a R 2 do atual modelo intercepto. O R 2 avaliado de 0,9993 considera esta diferenga. (Veja os 
varios programas para mais detalhes sobre como o R 2 esta correto ao considerar a ausencia do termo intercepto. 
Veja tambem o Apendice 6A, Segao 6A1.) 
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cidos, havera uma forma de obter estimativas consistentes (no sentido estatfstico) das variancias e 
covariancias dos estimadores de MQO, mesmo quando ha heterocedasticidade? A resposta e sim. 

Variancias e erros padrdo consistentes para heterocedasticidade de White 

White mostrou que esta estimativa pode ser realizada de modo que inferencias estatfsticas validas 
assintoticamente (i.e., para amostras grandes) possam ser feitas sobre os verdadeiros valores dos 
parametros. 34 Nao apresentaremos os detalhes matematicos, pois estao alem do escopo deste livro. 
No entanto, o Apendice 11 A.4 delineia o procedimento de White. Hoje, varios programas apresentam 
as variancias de heterocedasticidade de White e erros padrao com as variancias dos MQO e erros 
padrao usuais. 35 A proposito, os erros padrao corrigidos para a heterocedasticidade de White tambem 
sao conhecidos como erros padrao robustos. 


EXEMPLO 11.8 

Como exemplo, vejamos os resultados de Greene: 36 

Ilustracdo de 
procedimento de 

Y, = 832,91 - 

1834,2 (Renda) + 

1587,04 (Renda) 2 

White 

ep MQO = (327,3) 

(829,0) 

(519,1) 


t= (2,54) 

(2,21) 

(3,06) 


ep White = (460,9) 

(1243,0) 

(830,0) (11.6.4) 


t= 0,81) 

(-1,48) 

(1,91) 


em que Y = gastos per capita com escolas publicas por estado em 1979 e Renda = renda per 
capita por estado em 1979. A amostra consistia em 50 Estados mais Washington, DC. 


Como os resultados anteriores mostram, os erros padrao corrigidos para heterocedasticidade sao 
consideravelmente maiores que os obtidos pelos MQO. Com base nos ultimos, ambos os regressores 
sao estatisticamente significantes no nivel de 5%; com base nos estimadores de White eles nao sao. 
Deve-se destacar que os erros padrao corrigidos para heterocedasticidade de White podem ser maio¬ 
res ou menores que os nao corrigidos. 

Uma vez que os estimadores consistentes para heterocedasticidade de White agora estao dispomveis 
em programas de regressao, recomenda-se que o leitor os indique. Como Wallace e Silver observant: 

Em termos gerais, provavelmente e uma boa ideia usar a op§ao de WHITE [disponfvel em programas 
de regressao] como rotina, talvez comparando o resultado com resultados obtidos regularmente com os 
MQO como verificacao, para ver se a heterocedasticidade e um problema grave em determinado con- 
junto de dados. ’ 7 


Hipoteses plausiveis sobre o padrdo de heterocedasticidade 

Alem de ser usado para amostras amplas, uma desvantagem do procedimento de White e que os 
estimadores obtidos podem nao ser tao eficientes quanto os obtidos pelos metodos que transfonnam 
dados, para refletir tipos especificos de heterocedasticidade. Para ilustrar isso, voltemos ao modelo de 
regressao de duas variaveis: 

Y t = fi\ + fa Xi + iij 


Agora consideramos varias pressuposhjoes sobre o padrao de heterocedasticidade. 


34 Veja H. White, op. cit. 

35 Tecnicamente, eles sao conhecidos como estimadores consistentes da matriz de covariancia para 
heterocedasticidade. 

36 GREENE, William H. Econometric analysis. 2. ed. Nova York: Macmillan, 1993. p. 385. 

37 WALLACE, T. Dudley; SILVER, J. Lew. Econometrics: an introduction. Reading, Mass.: Addison-Wesley, 1988. 
p. 265. 
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HIPOTESE 1 

A variancia do erro e proporcional a Xj. 



E(u 2 ) = a 2 Xf 

(11.6.5) J8 


Se, em fitnpao de metodos graficos “especulativos” ou das abordagens de Park e Glejser, acredi- 
tamos que a variancia de u, e proporcional ao quadrado da variavel explanatoria X (veja a Figura 
11.10), pode-se transformar o modelo original como se segue. Dividimos o modelo original por Xf. 


Yi_ 

Xi 


fa 

Xi\ 


+ fa + 


Uf 

~Xi 


1 

- fa — + Pi + Vi 

X-i 


( 11 . 6 . 6 ) 


em que v,- e o termo de erro transformado, igual a u/X r Agora e facil verificar que 

£W) = £ (l) i= 

= a 2 usando (11.6.5) 

Por isso a variancia de v, agora e homocedastica e pode-se proceder aplicando os MQO a equapao 
transformada (11.6.6), fazendo a regressao YjlXi contra 1 IX r 

Note que na regressao transformada o termo de intercepto fa e o coeficiente angular na equapao 
original e o coeficiente angular ySj e o termo de intercepto no modelo original. Para voltarmos ao 
modelo original, temos de multiplicar a equa 5 ao estimada (11.6.6) por X r Uma aplica 5 ao dessa trans- 
formapao esta no Exercicio 11.20. 


HIPOTESE 2 


A variancia de erro e proporcional a X,. A transformacao raiz quadrada: 


E 



(11.6.7) 


FIGURA 11.10 

Variancia do erro 
proporcional a X 2 . 






X 


38 


Lembre-se de que ja encontramos essa hipotese em nossa discussao do teste de Goldfeld-Quandt. 
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Se acreditamos que a variancia de u h em vez de ser proporcional ao X, elevado ao quadrado, e 
proporcional ao proprio X h o modelo original pode ser transformado da seguinte maneira (veja a Fi¬ 
gure 11.11): 


Yi 








&2y[Xi + 


Vj 


( 11 . 6 . 8 ) 


em que v , = e X { > 0. 

Dada a Hipotese 2, pode-se verificar prontamente que E (vf) = a 2 , uma situagao homocedastica. 
Portanto,pode-seprosseguireaplicarosMQOa(11.6.8),fazendoaregressaodeF,/ ^/X) contra 1/ 

e yxT. 

Note um importante aspecto do modelo transformado: nao ha o termo intercepto. Portanto, e ne- 
cessario utilizar o modelo regressao atraves da origem para estimar fi, e /F. Pela Equagao (11.6.8), 
obtem-se o modelo original simplesmente multiplicando a Equagao (11.6.8) por ^/X). 

Um caso interessante e o modelo de intercepto zero, a saber, Y, = fi^X, + u,. Neste caso, a Equa¬ 
gao (11.6.8) toma-se: 


E pode-se mostrar que 





(11.6.8a) 


(11.6.8b) 


Ou seja, o estimador de mfnimos quadrados ponderados e apenas a relagao entre as variaveis de- 
pendente e explanatoria. (Para provar a Equagao (11.6.8b), aplique a formula de regressao que passa 
pela origem dada na Equagao (6.1.6).) 


HIPOTESE 3 A variancia do erro e proporcional ao quadrado do valor medio de Y. 

E(u 2 )= a 2 [E(Yi)] 2 


(11.6.9) 


FIGURA 11.11 

Variancia do erro 
proporcional a X. 


X 
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HIPOTESE 4 


A Equapao (11.6.9) postula que a variancia de m, e proporcional ao quadrado do valor esperado de 
Y (veja a Figura 11.8e). Agora 


E(Y,) = ft + p 2 X t 

Portanto, se transformamos a equapao original como se segue, 

Yi „ Xi Ui 


E(Yt ) E(Y t ) 


Xi 

+ Pi _ + 


= Pi 


1 


E(Ji) 


E(Yj) E(Yj) 

Xi 


+ Pi 


E{Y) 


+ Vi 


( 11 . 6 . 10 ) 


em que v, = «,/£,’(!)■), pode-se ver que E(vf) = a 2 ; isto e, os termos de erro v, sao homocedasticos. 
A regressao (11.6.10) ira satisfazer a hipotese da homocedasticidade do modelo classico de re¬ 
gressao linear. 

A transformapao (11.6.10) e, no entanto, inoperante, porque E(Y/) depende de p : e p 2 , que sao 
desconhecidos. Evidentemente, sabemos que Y t = P\ + P 2 X h que e um estimador de E(Y/). Podemos 
prosseguir em duas etapas: primeiro, fazemos a regressao usual de MQO, sem levar em considerapao 
o problema da heterocedasticidade, e obtemos Y t . Entao, usando o Y, estimado, transformamos nosso 
modelo da seguinte maneira: 

r A (i) +ft ( f) +v ' ("- 6 - 11 ) 

em que v, = ( u/Y ,). Na segunda etapa, calculamos a regressao (11.6.11). Embora Y t nao seja exata- 
mente £(!)■), eles sao estimadores consistentes; isto e, quando o tamanho da amostra aumenta indefini- 
damente, eles convergem para os verdadeiros E( Yj). Desse modo, a transforma 5 ao (11.6.11) tera um 
desempenho satisfatorio na pratica se o tamanho da amostra for razoavelmente grande. 


Uma transformagao logaritmica como 


In Yj = p-\ + p 2 In X, + u, (11.6.12) 

muito frequentemente reduz a heterocedasticidade quando comparada com a regressao V) = 

Pa + P 2^ i+ Ui- 


Esse resultado ocorre, porque a transformagao logaritmica comprime as escalas em que as 
variaveis sao medidas, reduzindo uma diferen 5 a de dez vezes entre dois valores para uma diferenga 
de duas vezes. Assim, o numero 80 e 10 vezes o numero 8, mas In 80 (= 4,3280) e cerca de duas vezes 
maior que In 8 (= 2,0794). 

Uma vantagem adicional da transformapao logaritmica e que o coeficiente angular p 2 mede a 
elasticidade de Y com relapao a X, ou seja, a mudanpa percentual em Y para uma mudanca percentual 
em X. Por exemplo, se Y e consumo e X e renda, p 2 na Equapao (11.6.12) mede a elasticidade da 
renda, enquanto no modelo original P 2 mede apenas a taxa de variapao do consumo medio por unida- 
de de variapao na renda. Essa e uma das razoes para os modelos logarftmicos serem muito populares 
em econometria empirica. (O Exercicio 11.4 apresenta alguns dos problemas associados a transfor- 
mapao logaritmica.) 

Para concluirmos nossa discussao das medidas corretivas, voltamos a enfatizar que todas as trans- 
formapoes discutidas anteriormente sao ad hoc\ estamos especulando sobre a natureza do of. Depen- 
dendo da natureza do problema e da gravidade da heterocedasticidade, determinaremos qual das 
transformapoes discutidas funcionara. Ha alguns problemas adicionais com as transformapoes consi- 
deradas que deveriamos ter em mente: 
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1. Quando vamos alem do modelo de duas variaveis, podemos nao saber a priori qual das variaveis 
X e Y devera ser escolhida para transformar os dados . 39 

2. A transformaijao logan'tmica, conforme discutido na Hipotese 4, nao e aplicavel se alguns dos 
valores deleyforem zero ou negativos . 40 

3. Ha o problema de correla<jao espuria. Esse termo, atribuido a Karl Pearson, refere-se a situapao 
em que se encontra correla£ao nas razoes das variaveis, mesmo que as variaveis originais nao 
estejam correlacionadas ou sejam aleatorias . 41 Assim, no modelo Y t = j J >\ + /) 2 A, + u it Y e X podem 
nao estar correlacionados, mas no modelo transformado Y,/X, = /3 1 (1/X - ,) + /b, Y/X, e I /X, estao 
frequentemente correlacionados. 

4. Quando os of nao sao conhecidos diretamente e sao estimados com base em uma ou mais transfor- 
ma 5 oes discutidas anteriormente, todos os nossos procedimentos de uso dos testes t, testes F etc. sao, 
falando em termos estritos, validos somente para amostras maiores. E preciso ser cuidadoso para 
interpretar os resultados com base nas varias transforma?5es em amostras pequenas ou finitas . 42 


11.7 Exemplos fiiiais 


Para concluirmos nossa discussao sobre heterocedasticidade, apresentamos tres exemplos ilus- 
trando os principais pontos abordados neste capftulo. 


EXEMPLO 11.9 

Mortalidade 

infantil 

revisitada 


Retornemos ao exemplo da mortalidade infantil, considerado em varias ocasioes. Dos 
dados para 64 pafses, obtemos os resultados de regressao mostrados na Equagao (8.1.4). 
Uma vez que temos dados de corte transversal, envolvendo diversos pafses com diferentes 
experiences de mortalidade, e provavel que possamos encontrar heterocedasticidade. Para 
descobrir isso, vamos primeiro considerar os resfduos obtidos na Equag:ao (8.1.4). Esses resf- 
duos sao tragados graficamente na Figura 11.12. Dessa figura, parece que os resfduos nao 
mostram qualquer padrao distinto que possa sugerir heterocedasticidade. No entanto, as 
aparencias enganam. Vamos aplicar os testes de Park, Glejser e White para verificar se ha 
qualquer evidencia de heterocedasticidade. 


Teste de Park. Como ha dois regressores, o PNB e o TAF, podemos fazer a regressao dos 
resfduos elevados ao quadrado por meio da regressao (8.1.4) em qualquer uma das variaveis. 
Ou, entao, podemos fazer a regressao deles contra os valores estimados de Ml (= Mi) obtidos 
na regressao (8.2.1). Com esta ultima, obtivemos os seguintes resultados: 


uf = 854,4006 + 5,7016 Ml, 
t= (1,2010) (1,2428) r 2 = 0,024 

Nota-.u, sao resfduos obtidos da regressao (8.1.4) e Ml sao os valores estimados de mi, da re¬ 
gressao (8.1.4). 

( Continua ) 


39 Entretanto, por praticidade, pode-se plotar uf contra cada variavel e decidir qual variavel X pode ser usada para 
transformar os dados. (Veja a Figura 11.9.) 

40 As vezes podemos usar In (V", + k ) ou In (X, + k), em que k e um numero positivo escolhido de tal maneira que 
todos os valores de Y e X tornem-se positivos. 

41 Por exemplo, se X 1( X 2 e X 3 sao mutuamente nao correlacionadas, r u = r 13 = r 23 = 0 e constatamos que os va¬ 
lores das razoes X^ /X 3 e X 2 /X 3 sao correlacionados, entao ha uma correlagao espuria. "Em termos mais gerais, 
a correlagao podera ser descrita como espuria se for induzida pelo metodo de condugao dos dados e nao esti- 
ver presente no material original." KENDALL, M. G.; BUCKLAND, W. R. A dictionary of statistical terms. Nova 
York: Hafner Publishing, 1972. p. 143. 

42 Para maiores detalhes, veja JUDGE, George G. et al., op. cit., segao 14.4, p. 415-420. 
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EXEMPLO 11.9 

( Continuagao ) 


Como mostra essa regressao, nao ha rela^ao sistematica entre os resfduos elevados ao 
quadrado e os valores estimados de Ml (por que?), sugerindo que a hipotese de homocedas- 
ticidade pode ser valida. Por sinal, regressar o logaritmo dos valores de resfduos elevados ao 
quadrado no logaritmo de mi nao mudou a conclusao. 


Teste de Glejser. Os valores absolutos dos resfduos obtidos na Equa^ao (8.1.4), 
quando regredidos contra o valor estimado de Ml da mesma regressao, deram os seguintes 
resultados: 


]u/| = 22,3127 + 0,0646 Ml, ^| 72 ) 

t= (2,8086) (1,2622) r 2 = 0,0250 

Novamente, nao ha uma relag:ao muito sistematica entre os valores absolutos dos resfduos e 
os valores estimados de Ml, na medida em que o coeficiente angular t nao e significativo 
estatisticamente. 

Teste de White. Aplicando o teste de heterocedasticidade de White com e sem os ter- 
mos dos produtos cruzados, nao encontramos evidencias de heterocedasticidade. Tambem 
estimamos novamente a Equafao (8.1.4) para obter os erros padrao e os valores de t consis- 
tentes com a heterocedasticidade de White, mas os resultados foram semelhantes aos da 
Equagao (8.1.4), o que nao deveria surpreender, tendo em vista os varios testes de heteroce¬ 
dasticidade conduzidos anteriormente. 

Em resumo, parece que nossa regressao de mortalidade infantil (8.1.4) nao sofre de hete¬ 
rocedasticidade. 


FIGURA 11.12 

Resfduos da 
regressao (8.1.4). 



EXEMPLO 11.10 

Despesas com 
P&D, vendas e 
lucro em 14 
segment os 
industriais nos 
Estados Unidos, 
2005 


A Tabela 11.5 apresenta dados sobre gastos com pesquisa e desenvolvimento (P&D), 
vendas e lucro para 14 segmentos industriais nos Estados Unidos (em milhoes de dolares). 
Uma vez que os dados de corte transversal desta tabela sao bastante heterogeneos, em uma 
regressao de P&D contra as vendas, a heterocedasticidade e provavel. Os resultados de re¬ 
gressao sao os seguintes: 


P&D, = 1338 
ep= (5015) 
t= (0,27) 


0,0437 Vendas, 
(0,0277) 

(1,58) 


r 2 = 0,172 


(11.7.3) 


Nao e de surpreender que haja uma relagao positiva entre P&D e vendas, embora nao seja 
estatisticamente positiva, nos nfveis tradicionais. 


( Continua ) 
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EXEMPLO 11.10 TABELA 11.5 Vendas e emprego para empresas com desempenho industrial de P&D nos Estados Unidos, 
( Continuagao ) P or setor, 2005 (valores em milhoes de dolares) 


Setor 

Vendas 

P&D 

Lucros 

Alimentos 

374.342 

2.716 

234.662 

Texteis, roupas e couro 

51.639 

816 

53.510 

Qufmicos basicos 

Resina, borracha sintetica, fibra 

109.899 

2.277 

75.168 

e filamentos 

132.934 

2.294 

34.645 

Farmaceuticos e remedios 

273.377 

34.839 

127.639 

Plasticos e produtos de borracha 

90.176 

1.760 

96.162 

Produtos fabricados de metal 

174.165 

1.375 

155.801 

Maquinario 

230.941 

8.531 

143.472 

Computadores e perifericos 

Semicondutores e outros 

91.010 

4.955 

34.004 

componentes eletronicos 

Instrumentos de navega^ao, de mensurafao. 

176.054 

18.724 

81.317 

aparelhos medicos e de controles 
Equipamentos eletrico, aparelhos 

118.648 

15.204 

73.258 

e componentes 

101.398 

2.424 

54.742 

Produtos e pegas aeroespaciais 

227.271 

15.005 

72.090 

Equipamentos medicos e suprimentos 

56.661 

4.374 

52.443 


Fonte: National Science Foundation, Division of Science Resources Statistics, Survey of Industrial Research and Development: 
2005 e o U.S. Census Bureau Annual Survey of Manufactures, 2005. 


Para ver se a regressao (11.7.3) sofre de heterocedasticidade, obtemos os resfduos, u„ e 
os resfduos elevados ao quadrado, uf, do modelo e plotamos contra vendas, como mostra a 
Figura 11.13. Observando essa figura, parece haver um padrao sistematico entre os resfduos e os 
resfduos elevados ao quadrado e vendas, sugerindo heterocedasticidade. Para testarmos formal- 
mente, empregamos os testes de Park, Glejser e White, que deram os resultados a seguir: 


FIGURA 11.13 

(a) e resfduos ao 
quadrado (b) 
contra vendas. 
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(Contin.ua) 
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EXEMPLO 11.10 

( Continuagao ) 


Teste de Park 


uf =- 72.493.719 + 916,1 Vendas, 
ep= (54.940.238) (303,9) 

t= (-1,32) (3,01) r 2 = 0,431 (11.7.4) 


O teste de Park sugere que ha uma relagao significativa positiva entre os resfduos elevados 
ao quadrado e as vendas. 

Teste de Glejser 

\Qf\ = - 1003 + 0,04639 Vendas, 
ep= (2316) (0,0128) 

t= (-0,43) (3,62) r 2 = 0,522 (11.7.5) 

O teste de Glejser tambem sugere que ha uma relagao sistematica entre os valores abso- 
lutos dos resfduos e vendas, levantando a possibilidade de que a regressao (11.7.3) seja afe- 
tada pela heterocedasticidade. 


Teste de White 


uf = - 46.746.325 + 
ep= (112.224.348) 
t= (-0,42) 


578 Vendas, + 0,000846 Vendas, 2 
(1308) (0,003171) 

(0,44) (0,27) 

R 2 = 0,435 


(11.7.6) 


Usando o valor de R 2 e n = 14, obtemos n R 2 = 6,090. Sob a hipotese nula de ausencia 
de heterocedasticidade, isto deveria seguir uma distribuifao de qui-quadrado com 2 graus de 
liberdade (porque ha dois regressores na Equa^ao (11.7.6)). O p-valor de obter um valor qui- 
quadrado de pelo menos 6,090 ou maior e cerca de 0,0476. Uma vez que esse e um valor 
baixo, o teste de White tambem sugere que ha heterocedasticidade. 

Em resumo, com base nos graficos dos resfduos e dos testes de Park, Glejser e White, 
parece que nossa regressao de P&D (11.7.3) e afetada pela heterocedasticidade. Como a 
verdadeira variancia do erro nao e conhecida, nao podemos usar o metodo dos mfnimos 
quadrados ponderados para obter os erros padrao e valores t corrigidos para heterocedasti¬ 
cidade. Temos de fazer suposifoes, com base nos dados disponfveis, sobre a natureza da 
variancia do erro. 


Para concluirmos nosso exemplo, apresentamos os erros padrao consistentes com a hete¬ 
rocedasticidade de White, como discutido na Sefao 11.6. 


P & D, = 1337,87 + 
ep= (4892,447) 
t= (0,27) 


0,0437 Vendas, 
(0,0411) 

(1,06) r 2 


0,172 


(11.7.7) 


Comparando a Equagao (11.7.7) com a Equagao (11.7.3) (a ultima nao tendo sido 
correlacionada para heterocedasticidade), vemos que as estimativas dos parametros nao 
mudaram (como esperarfamos), o erro padrao do coeficiente de intercepto diminuiu ligei- 
ramente e o erro padrao do coeficiente angular aumentou ligeiramente. Mas lembre-se de 
que o procedimento de White e estritamente de amostra grande, enquanto temos apenas 
14 observafoes. 
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EXEMPLO 11.11 A Tabela 11.16 no site do livro fornece salario e dados relacionados em 94 distritos esco- 
lares no noroeste de Ohio. Inicialmente, a regressao a seguir foi estimada com base nesses 
dados: 

In (Salario), = fi i + /3 2 In (RendaFam) + /? 3 In (ValorProp) + u ,• 

em que Salario = salario medio dos professores ($), RendaFam = renda familiar media no 
distrito ($) e ValorProp = valor medio da propriedade no distrito ($). 

Como este e um modelo log-log, todos os coeficientes angulares sao elasticidades. Com 
base nos varios testes de heterocedasticidade discutidos no texto, verificou-se que o modelo 
anterior foi afetado pela heterocedasticidade. Portanto, obtivemos os erros padrao robustos 
(de White). A tabela a seguir apresenta os resultados da regressao anterior com e sem erros 
padrao robustos. 


Variavel 

Coeficiente 

ep MQO 

ep robusto 

Intercepto 

7,0198 

0,8053 

0,7721 

In(RendaFam) 

0,2575 

(8,7171) 

0,0799 

(9,0908) 

0,1009 

In(ValorProp) 

0,0704 

(3,2230) 

0,0207 

(2,5516) 

0,0460 

R 2 

0,2198 

(3,3976) 

(1,5311) 


Nota: dados entre parenteses sao os valores estimados das razoes t. 


Embora os valores de coeficientes e de R 2 permanegam os mesmos quer usemos o meto- 
do dos MQO ou o de White, os erros padrao mudaram; a mudanga mais acentuada esta no 
erro padrao do coeficiente de In(ValorProp). O metodo dos MQO sugeriria que o coeficiente 
estimado dessa variavel e altamente significativo do ponto de vista estatfstico, enquanto 
o erro padrao robusto de White sugere que esse coeficiente nao e significativo nem mesmo 
ao nfvel de 10%. Este exemplo mostra que, se ha heterocedasticidade, deverfamos leva-la em 
conta ao estimarmos um modelo. 


11.8 


Uma advertencia sobre reaches exageradas a heterocedasticidade 


Retomando o exemplo de P&D discutido na seqao anterior, vimos que, quando usamos a transfor- 
ma 5 ao raiz quadrada para corrigir a heterocedasticidade no modelo original (11.7.3), o erro padrao do 
coeficiente angular diminuiu e seu valor t aumentou. A mudanqa e tao significativa que seria preocu- 
pante na pratica? Em outras palavras, quando devemos ficar preocupados com o problema da hetero¬ 
cedasticidade? Como defende um autor, “a heterocedasticidade nunca foi razao para descartar-se um 
modelo que, sob outros aspectos, e considerado bom”. 43 

Neste ponto, pode ser util ter em mente a advertencia feita por John Fox: 

[...] vale corrigir variancias desiguais do erro somente quando o problema for grave. 

O impacto da variancia do erro nao constante sobre a eficiencia do estimador de mrnimos quadrados 
e na validade da eficiencia dos minimos quadrados depende de varios fatores, inclusive do tamanho da 
amostra, do grau de variafao no of, da configuraqao dos valores de X [regressor] e da relajao entre a 
variancia dos erros e os X. Portanto, nao e possivel chegar a conclusoes gerais aplicaveis a respeito dos 
danos produzidos pela heterocedasticidade . 44 


43 MANKIW, N. Gregory. "A quick refresher course in macroeconomics." Journal of Economic Literature, dez. 1990. 
v. XXVIII, p. 1.648. 

44 FOX, John. Applied regression analysis, linear models, and related methods. California: Sage Publications, 1997. p. 306. 
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Resumo e 
conclusoes 


EXERCICIOS 


Voltando ao modelo (11.3.1), vimos que a variancia do estimador angular, var(/S 2 ), e dada pela 
formula comum mostrada em (11.2.3). Sob os MQG, a variancia do estimador angular, var( p%) e dada 
por (11.3.9). Sabemos que a ultima e mais eficiente que a primeira. Mas quanto a variancia de MQO deve 
ser maior em relagao a de MQG antes de tornar-se preocupante? Como regra pratica, Fox sugere que esse 
problema merece atengao “[...] quando a maior variancia do erro for mais de dez vezes a menor”. 45 Assim, 
voltando aos resultados das simulagoes de Monte Carlo de Davidson e MacKinnon apresentadas na Se- 
gao 11.4, considere o valor de a = 2. A variancia de fi 2 estimado e 0,04 sob MQO e 0,012 sob MQG, 
sendo a razao entre a primeira e a ultima cerca de 3,33. 46 De acordo com a regra de Fox, a gravidade da 
heterocedasticidade nesse caso pode nao ser grande o suficiente para gerar preocupagao. 

Devemos lembrar tambem que, apesar da heterocedasticidade, os estimadores de MQO sao linea- 
res, nao tendenciosos e (em condigoes gerais) tem distribuigao normal assintoticamente (i. e., em 
grandes amostras). 

Como veremos ao discutirmos outras violagoes das suposigoes do modelo classico de regressao 
linear, a advertencia nesta segao parece ser adequada como regra geral. Caso contrario, podemos exagerar. 


1. Uma hipotese fundamental do modelo classico de regressao linear e que os termos de erro t/,- tem, 
todos, a mesma variancia, er. Se essa hipotese nao for satisfeita, havera heterocedasticidade. 

2. A heterocedasticidade nao invalida as propriedades de consistencia e nao tendenciosidade dos 
estimadores de MQO. 

3. Esses estimadores, no entanto, nao tem mais variancia minima nem sao eficientes. Ou seja, nao 
sao MELNT. 

4. Os estimadores MELNT sao fomecidos pelo metodo de mmirnos quadrados ponderados, con- 
tanto que as variancias heterocedasticas dos erros, of, sejam conhecidas. 

5. Na presenga de heterocedasticidade, as variancias dos estimadores de MQO nao sao fomecidas pelas 
formulas usuais de MQO. Mas, se persistirmos em usar as formulas MQO usuais, os testes t e F 
baseados nelas podem ser altamente enganosos, resultando em conclusoes incorretas. 

6. Documentar as consequencias da heterocedasticidade e mais facil que detecta-la. Ha varios testes 
disponfveis para diagnosticos, mas nao se pode dizer com certeza qual deles funcionara em deter- 
minada situagao. 

7. Mesmo que a heterocedasticidade seja suspeita e detectada, nao e facil corrigir o problema. Se a 
amostra e grande, pode-se obter os erros padrao ajustados para heterocedasticidade de White com 
base nos estimadores de MQO e conduzir inferencia estatfstica com base nesses erros padrao. 

8. Caso contrario, com base nos resfduos dos MQO, pode-se fazer inferencias baseadas em informa- 
goes do provavel padrao da heterocedasticidade e transformar os dados originais de tal forma que, 
nos dados transformados, nao haja heterocedasticidade. 


11.1. Diga se as afirmagoes a seguir sao verdadeiras, falsas ou incertas e apresente uma breve justi- 
ficativa: 

a. Na presenga da heterocedasticidade, os estimadores de MQO sao tendenciosos, bem como 
ineficientes. 

b. Se a heterocedasticidade estiver presente, os testes t e F convencionais serao invalidos. 

c. Na presenga de heterocedasticidade, o metodo usual de MQO sempre estima os erros pa¬ 
drao dos estimadores para mais. 


45 Ibid., p. 306. 

46 Note que elevamos os erros padrao ao quadrado para obter as variancias. 
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d. Se os residuos estimados de uma regressao MQO exibirem um padrao sistematico, signifi- 
ca que a heterocedasticidade esta presente nos dados. 

e. Nao ha teste geral de heterocedasticidade que seja livre de qualquer pressuposto a respeito 
de qual variavel o termo de erro esta correlacionado. 

f. Se um modelo de regressao for mal especificado (isto e, uma variavel importante e omiti- 
da), os residuos de MQO mostrarao um padrao distinto. 

g. Se o regressor que tem uma variancia nao constante for (incorretamente) omitido de um 
modelo, os residuos (MQO) serao heterocedasticos. 

11.2. Em uma regressao de salarios medios (W, $) contra o numero de funcionarios (AO, para uma 
amostra randomica de 30 empresas, foram obtidos os seguintes resultados da regressao:* 


W = 7,5 + 0,009N 

t= n.a. (16,10) R 2 = 0,90 


( 1 ) 


W/N= 0,008 + 7,8(1 /N) 

t = (14,43) (76,58) R 2 = 0,99 


( 2 ) 


a. Como se interpreta as duas regressoes? 

b. O que o autor esta supondo ao passar da Equa§ao (1) para a Equa§ao (2)? Ele estaria preo- 
cupado com a heterocedasticidade? Como se pode saber? 


c. E possivel relacionar os coeficientes angulares e os interceptos dos dois modelos? 

d. Pode-se comparar os valores R 1 dos dois modelos? Por que? 


11.3. a. E possivel estimar os parametros dos modelos 


| Mi | - y/P\ + PlXi + Vi 



pelo metodo dos minimos quadrados ordinarios? Por que? 
b. Se nao for, e possivel sugerir um metodo, informal ou formal, de estimar os parametros de 
tais modelos? (Veja o Capitulo 14.) 


11.4. Embora os modelos logaritmicos mostrados na Equa 5 ao (11.6.12) reduzam com frequencia a 


heterocedasticidade, e preciso estar atento as propriedades do termo de erro de tais modelos. 
Por exemplo, o modelo 



( 1 ) 


pode ser escrito como 


In 7, = ln/1] + 2 1 nlj + In m, 


( 2 ) 


a. Se In m, precisa ter expectativa zero, qual devera ser a distribuipao de uf! 

b. Se E(u.) = 1, £(ln «,) = 0? Por que? 

c. Se E( I n up nao for zero, o que deve ser feito para que se torne zero? 


11.5 Mostre que fi% da Equapao (11.3.8) tambem pode ser expresso como 



* Veja SALVATORE, Dominick. Managerial Economics, McGraw-Hill, New York, 1989, p. 157. 
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e a var (ft) dada na Equagao (11.3.9) tambem pode ser expressa como 


em que y* = Y t - Y* e xf = Xj - X representam desvios das medias ponderadas Y * e X* defini- 
das como 

r = J2 WiY ‘/H w ‘ 

x * = y^wjXj j Wj 

11.6 Para fins pedagogicos, Hanushek e Jackson estimaram o seguinte modelo: 

C t = ft + ftPNB,+ ftA + Uj (1) 


em que C, = despesa agregada privada de consumo no ano t, PNB, = produto nacional bruto no 
ano 1 e D = despesas com defesa nacional no ano t, sendo o objetivo da analise estudar o efeito 
das despesas com defesa contra outras despesas na economia. 

Postulando que oj = a 2 (PNB t ) 2 , eles transformam (1) e estimam 


C,/PNB, = ft\ (1/PNB,) + ft + A (A/PNB,) + zftPNB, (2) 


Os resultados empfricos baseados nos dados para 1946-1975 foram os seguintes (erros padrao 
entre parenteses):* 


C t 


Q/PNB, 


26,19 + 0,6248 PNB,- 

(2,73) (0,0060) 

25,92 (1/GNP,)+ 0,6246 
(2,22) (0,0068) 


0,4398 A 
(0,0736) 

0,4315 (A/GNPd 
(0,0597) 


R 2 = 0,999 
R 2 = 0,875 


a. O que os autores pressupoem sobre a natureza da heterocedasticidade? E posslvel justifica-la? 

b. Compare os resultados das duas regressoes. A transforma 5 ao do modelo original contribuiu 
para os resultados, isto e, reduziu os erros padrao estimados? Por que? 

c. E possfvel comparer os dois valores R 2 ? Por que? ( Sugestao: examine as variaveis depen- 
dentes.) 

11.7. Consulte a regressao estimada nas Equagoes (11.6.2) e (11.6.3). Os resultados da regressao sao 
bem semelhantes. O que explicaria esse resultado? 

11.8 Prove que, se w,- = w, uma constante, para cada i, ft e ft, bem como suas variancias sao iden- 
ticas. 

11.9 Consulte as formulas (11.2.2) e (11.2.3). Suponha que 


a 2 = a 2 kj 

em que a 2 e uma constante e k, sao pesos conhecidos, nao necessariamente todos iguais. 
Usando esse pressuposto, mostre que a variancia da Equapao (11.2.2) pode ser expressa como 

~ 2 


var (ft) = 


E x f E x ? 


HANUSHEK, Eric A. e JACKSON, John E., Statistical Methods for Social Scientists, Academic, New York, 1977, p. 160. 
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O primeiro termo no lado direito e a formula de variancia dada na Equagao (11.2.3), isto e, 
var (/S 2 ) sob homocedasticidade. O que se pode dizer sobre a natureza da relagao entre 
var (/J 2 ) sob heterocedasticidade e sob homocedasticidade? ( Sugestao: examine o segundo 
termo no lado direito da formula anterior.) E possrvel tirar qualquer conclusao geral sobre a 
relagao entre as Equagoes (11.2.2) e (11.2.3)? 

11.10. No modelo 


y, = /T A, + Ui ( Nota: nao ha intercepto) 


informa-se que a var («,) = crXf. Mostre que 


var(yS 2 ) = 


g2 E^f 

(E4) 2 


Exercicios aplicados 

11.11. Para os dados da Tabela 11.1, calcule a regressao da remuneragao media Y contra a produti- 
vidade media X, tratando o numero de funcionarios como a unidade de observagao. Interpre- 
te seus resultados e veja se estao de acordo com os da Equagao (11.5.3). 

a. Da regressao anterior, obtenha os resfduos 

b. Seguindo o teste de Park, faga a regressao In iIf contra In X, e verifique a regressao 
(11.5.4). 

c. Seguindo a abordagem de Glejser, fag a a regressao |«,| contra X, e depois faca a regressao 
| Ui | contra e comente seus resultados. 

d. Encontre a correlagao por ordem entre \u,\ e X, e comente sobre a natureza da heteroce¬ 
dasticidade, se houver, presente nos dados. 

11.12. ATabela 11.6 apresenta dados relativos a razao vendas/dinheiro em caixa de industrias de ma- 
nufatura norte-americanas classificadas pelo tamanho do ativo para o 1° trimestre de 1971 ao 
4° trimestre de 1974. (Dados trimestrais.) A razao vendas/dinheiro em caixa pode ser consi- 
derada uma medida da velocidade da renda no setor empresarial, isto e, o numero de vezes 
que um dolar gira. 

a. Para cada tamanho de ativo, calcule a media e o desvio padrao da razao vendas/dinheiro em 
caixa. 

b. Trace graficamente o valor medio contra o desvio padrao como calculado em (a), usando o 
tamanho do ativo como unidade de observagao. 


TABELA 11.6 

Ano e 








Tamanho do ativo 

Trimestre 

1-10 

10-25 

25-50 

50-100 

100-250 

250-1.000 

1.000 + 

(milhoes de dolares) 

1971-1 

6,696 

6,929 

6,858 

6,966 

7,819 

7,557 

7,860 

Fonte: Quartely Financial 

-II 

6,826 

7,311 

7,299 

7,081 

7,907 

7,685 

7,351 

Report for Manufacturing 
Corporations, Federal Trade 
Commission and the 

-III 

-IV 

6,338 

6,272 

7,035 

6,265 

7,082 

6,874 

7,145 

6,485 

7,691 

6,778 

7,309 

7,120 

7,088 

6,765 

Securities and Exchange 
Commission, U.S. 
govermment, varios 

numeros. 

1972-1 

-II 

6,692 

6,818 

6,236 

7,010 

7,101 

7,719 

7,060 

7,009 

7,104 

8,064 

7,584 

7,457 

6,717 

7,280 

-III 

6,783 

6,934 

7,182 

6,923 

7,784 

7,142 

6,619 


-IV 

6,779 

6,988 

6,531 

7,146 

7,279 

6,928 

6,919 


1973-1 

7,291 

7,428 

7,272 

7,571 

7,583 

7,053 

6,630 


-II 

7,766 

9,071 

7,818 

8,692 

8,608 

7,571 

6,805 


-III 

7,733 

8,357 

8,090 

8,357 

7,680 

7,654 

6,772 


-IV 

8,316 

7,621 

7,766 

7,867 

7,666 

7,380 

7,072 
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c. Por meio de um modelo de regressao adequado, decida se o desvio padrao da razao aumen- 
ta com o valor medio. Se nao for esse o caso, como o resultado poderia ser explicado? 

d. Se ha uma relapao estatisticamente significativa entre os dois, como se transformariam os 
dados de modo que nao haja heterocedasticidade? 


11.13. Teste de homogeneidade da variancia de Bartlett* Suponha que haja k variancias amostrais 
independentes s\, s\ ... sj com j\ ,/ 2 , ... f graus de liberdade, cada uma de popula£oes dis- 
tribufdas normalmente com media /i e variancia of. Suponha ainda que desejemos testar a 
hipotese nula H 0 : of = of = • • • of = o 2 ; isto e, cada variancia da amostra e uma estimativa da 
mesma variancia populacional o 2 . 


Se a hipotese nula for verdadeira, entao 


k 



fornece uma estimativa da estimativa comum (combinada) da variancia populacional a 2 , em 


que fj = (rij - 1), sendo n, o numero de observances no i-esimo grupo e / = Yi= i f ■ 


Bartlett mostrou que a hipotese nula pode ser testada por meio da razao A/B, distribufda 


aproximadamente como a distribute x 2 com k - I graus de liberdade, em que 


A = fins 2 - if ln ^ 2 ) 


e 



Aplique o teste de Bartlett aos dados da Tabela 11.1 e verifique se a hipotese de que as varian¬ 
cias populacionais da remuneranao de funcionarios sao as mesmas para cada tamanho de 
estabelecimento nao pode ser rejeitada no nivel de 5% de significance. 

Nota\ f h o grau de liberdade de cada variancia amostral, e 9, uma vez que para cada amos¬ 
tra (classe de emprego) e 10. 

11.14. Considere o seguinte modelo de regressao que passa pela origem: 


Yj = fiXj + Uj, para i = 1,2 


Foi informado que tq ~ N (0, o 2 ) e u 2 ~ N (0, 2o 2 ) e que eles sao estatisticamente indepen¬ 
dentes. Se 2£j = +1 e X 2 = — 1, obtenha a estimativa de mmimos quadrados ponderados 
(MQP) de p e de sua variancia. Se nesta situafao for pressuposto incorretamente que as duas 


variancias do erro sao iguais (digamos, iguais a o 2 ), qual sera o estimador de MQO de ft'! E 


sua variancia? Compare as estimativas com as obtidas pelo metodo dos MQP. A que conclu- 


sao geral pode-se chegar? 1 


11.15. A Tabela 11.7 apresenta dados de 81 carros sobre MPG (milhas por galao de combustivel), 
HP (potencia do motor), VOL (espapo interno em metros cubicos), PV (velocidade maxima, 
milhas por hora), e PV (peso do veiculo em 100 libras). 
a. Considere o modelo a seguir: 


MPG, = fti + ftVM, + ftHP, + j&tPV,- + «, 


Estime os parametros desse modelo e interprete os resultados. Eles fazem sentido econo¬ 
mic amente? 

b. Seria de esperar que a variancia do erro no modelo anterior seja heterocedastica? Por que? 


* Veja "Properties of Sufficiency and Satatistical Tests," Proceeding of the Royal Society of London A, vol. 160, 1937, 

p. 268. 

f Adaptado de SEBER, F. A. F. Linear regression analysis. Nova York: John Wiley & Sons, 1977. p. 64. 
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c. Use o teste de White para descobrir se a variancia de erro e heterocedastica. 

d. Obtenha os erros padrao consistentes com a heterocedasticidade e valores t, e compare seus 
resultados com aqueles obtidos pelos MQO. 

e. Se a heterocedasticidade for comprovada, como os dados seriam transformados para que a 
variancia seja homocedastica? Mostre os calculos necessarios. 

TABELA 11.7 


Observa^ao 

MPG 

VM 

HP 

VOL 

PV 

Observagao 

MPG 

VM 

HP 

VOL 

PV 

1 

65,4 

96 

49 

89 

17,5 

42 

32,2 

106 

95 

106 

30,0 

2 

56,0 

97 

55 

92 

20,0 

43 

32,2 

109 

102 

92 

30,0 

3 

55,9 

97 

55 

92 

20,0 

44 

32,2 

106 

95 

88 

30,0 

4 

49,0 

105 

70 

92 

20,0 

45 

31,5 

105 

93 

102 

30,0 

5 

46,5 

96 

53 

92 

20,0 

46 

31,5 

108 

100 

99 

30,0 

6 

46,2 

105 

70 

89 

20,0 

47 

31,4 

108 

100 

111 

30,0 

7 

45,4 

97 

55 

92 

20,0 

48 

31,4 

107 

98 

103 

30,0 

8 

59,2 

98 

62 

50 

22,5 

49 

31,2 

120 

130 

86 

30,0 

9 

53,3 

98 

62 

50 

22,5 

50 

33,7 

109 

115 

101 

35,0 

10 

43,4 

107 

80 

94 

22,5 

51 

32,6 

109 

115 

101 

35,0 

11 

41,1 

103 

73 

89 

22,5 

52 

31,3 

109 

115 

101 

35,0 

12 

40,9 

113 

92 

50 

22,5 

53 

31,3 

109 

115 

124 

35,0 

13 

40,9 

113 

92 

99 

22,5 

54 

30,4 

133 

180 

113 

35,0 

14 

40,4 

103 

73 

89 

22,5 

55 

28,9 

125 

160 

113 

35,0 

15 

39,6 

100 

66 

89 

22,5 

56 

28,0 

115 

130 

124 

35,0 

16 

39,3 

103 

73 

89 

22,5 

57 

28,0 

102 

96 

92 

35,0 

17 

38,9 

106 

78 

91 

22,5 

58 

28,0 

109 

115 

101 

35,0 

18 

38,8 

113 

92 

50 

22,5 

59 

28,0 

104 

100 

94 

35,0 

19 

38,2 

106 

78 

91 

22,5 

60 

28,0 

105 

100 

115 

35,0 

20 

42,2 

109 

90 

103 

25,0 

61 

27,7 

120 

145 

111 

35,0 

21 

40,9 

110 

92 

99 

25,0 

62 

25,6 

107 

120 

116 

40,0 

22 

40,7 

101 

74 

107 

25,0 

63 

25,3 

114 

140 

131 

40,0 

23 

40,0 

111 

95 

101 

25,0 

64 

23,9 

114 

140 

123 

40,0 

24 

39,3 

105 

81 

96 

25,0 

65 

23,6 

117 

150 

121 

40,0 

25 

38,8 

111 

95 

89 

25,0 

66 

23,6 

122 

165 

50 

40,0 

26 

38,4 

110 

92 

50 

25,0 

67 

23,6 

122 

165 

114 

40,0 

27 

38,4 

110 

92 

117 

25,0 

68 

23,6 

122 

165 

127 

40,0 

28 

38,4 

110 

92 

99 

25,0 

69 

23,6 

122 

165 

123 

40,0 

29 

46,9 

90 

52 

104 

27,5 

70 

23,5 

148 

245 

112 

40,0 

30 

36,3 

112 

103 

107 

27,5 

71 

23,4 

160 

280 

50 

40,0 

31 

36,1 

103 

84 

114 

27,5 

72 

23,4 

121 

162 

135 

40,0 

32 

36,1 

103 

84 

101 

27,5 

73 

23,1 

121 

162 

132 

40,0 

33 

35,4 

111 

102 

97 

27,5 

74 

22,9 

no 

140 

160 

45,0 

34 

35,3 

111 

102 

113 

27,5 

75 

22,9 

110 

140 

129 

45,0 

35 

35,1 

102 

81 

101 

27,5 

76 

19,5 

121 

175 

129 

45,0 

36 

35,1 

106 

90 

98 

27,5 

77 

18,1 

165 

322 

50 

45,0 

37 

35,0 

106 

90 

88 

27,5 

78 

17,2 

140 

238 

115 

45,0 

38 

33,2 

109 

102 

86 

30,0 

79 

17,0 

147 

263 

50 

45,0 

39 

32,9 

109 

102 

86 

30,0 

80 

16,7 

157 

295 

119 

45,0 

40 

32,3 

120 

130 

92 

30,0 

81 

13,2 

130 

236 

107 

55,0 

41 

32,2 

106 

95 

113 

30,0 








Nota: VOL = espago interno em pes cubicos 
HP = potencia do motor 
MPG = milhas por galao 
VM = velocidade maxima, milhas por hora 
PV = peso do vefculo, em 100 libras 

Observagao = numero da observa^ao (as marcas dos carros nao foram reveladas) 


Fonte: U.S. Environmental Protection Agency, 1991, Relatorio EPA/AA;CTAB/91-02. 
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11.16. Gastos com alimentagao na India. Na Tabela 2.8 temos os dados sobre gastos com alimenta¬ 
gao e despesas totais para 55 famflias indianas. 

a. Faga a regressao dos gastos em alimentagao contra as despesas totais, e examine os resi- 
duos obtidos dessa regressao. 

b. Faga um grafico dos residuos obtidos em (a) contra as despesas totais e veja se ha qual- 
quer padrao sistematico. 

c. Se o grafico em (b) sugerir heterocedasticidade, aplique os testes de Park, Glejser e White 
para verificar se as impressoes de heterocedasticidade observadas em ( b ) sao confirma- 
das pelos testes. 

d. Obtenha os erros padrao consistentes para heterocedasticidade de White e compare-os 
com os dos MQP. Decida se vale a pena corrigir a heterocedasticidade neste exemplo. 

11.17. Repita o Exercicio 11.16, mas dessa vez faga a regressao do logaritmo de gastos com alimen¬ 
tagao contra o logaritmo de despesas totais. Se e observada heterocedasticidade no modelo 
linear do Exercicio 11.16, mas nao no modelo de logaritmo linear, a que conclusao e possivel 
chegar? Mostre todos os calculos necessarios. 

11.18. Um atalho para o teste de White. Como notado no texto, o teste de White pode consumir 
graus de liberdade se houver varios regressores e se introduzirmos todos os regressores, seus 
termos elevados ao quadrado e seus produtos cruzados. Em vez de estimar regressoes como 
a Equagao (11.5.22), por que simplesmente nao efetuar a seguinte regressao: 

u 2 — &\ + a.jYi + ot2 Y 2 + Vi 

em que Y, sao os valores estimados Y (regressandos) do modelo que voce esta estimando? 
Afinal, Y, e apenas a media ponderada dos regressores, com os coeficientes de regressao es¬ 
timados servindo como pesos. 

Obtenha o valor de R 2 da regressao anterior e use a Equagao (11.5.22) para testar a hipotese 
de que nao ha heterocedasticidade. 

Aplique o teste anterior para o exemplo de gastos com alimentagao do Exercicio 11.16. 

11.19. Retorne ao exemplo de P&D discutido na Segao 11.7 (Exercicio 11.10). Repita o exemplo 
usando lucros como regressor. A priori, voce esperaria que seus resultados fossem diferentes 
daqueles que usam vendas como o regressor? Por que? 

11.20. A Tabela 11.8 apresenta dados sobre salarios medios de professores de estatlstica em tempo 
integral em universidades de pesquisa nos Estados Unidos para o ano academico de 2007. 
a. Trace um grafico dos salarios medios contra os anos de exercicio da atividade (como uma 

medida dos anos de experiencia). Para tragar o grafico, suponha que os salarios medios 
referem-se ao ponto medio dos anos em ordem. Assim, o salario de $ 124.578 na ordem 
4-5 refere-se aos 4,5 anos na ordem e assim por diante. Para o ultimo grupo, suponha que 
a ordem seja 31-33. 


TABELA 11.8 

Salarios medios de 
professores de 
estatlstica em tempo 
integral, 2007. 

Fonte: Americal Statistical 
Association, “2007 Salary 
Report”. 


Anos no cargo 

Contagem 

Salario medio em (USS) 

0 a 1 

40 

$101,478 

2 a 3 

24 

102.400 

4 a 5 

35 

124.578 

6 a 7 

34 

122.850 

8 a 9 

33 

116.900 

10 a 14 

73 

119.465 

15 a 19 

69 

114.900 

20 a 24 

54 

129.072 

25 a 30 

44 

131.704 

31 ou mais 

25 

143.000 
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b. Considere os seguintes modelos de regressao: 

Yi = ct\ + oiiXi + Uj ( 1 ) 

Yi = + PiXj + foXf + v t ( 2 ) 

em que Y = salario medio, X = anos no cargo (medidos no ponto medio do intervalo) e u e 
v sao os termos de erro. Que argumentos poderiam ser usados para defender por que o 
modelo (2) poderia ser preferivel ao modelo (1)? Por meio dos dados, calcule os modelos. 

c. Se for observada heterocedasticidade no modelo (1), mas nao no modelo (2), a que conclu- 
sao se poderia chegar? Mostre os calculos necessarios. 

d. Se a heterocedasticidade e observada no modelo (2), como transformariamos os dados de 
modo que no modelo transformado nao houvesse heterocedasticidade? 

11.21. Tendo os dados: 

SQR, com base nas 30 primeiras observagoes = 55, graus de liberdade = 25 

SQR 2 com base nas 30 ultimas observances = 140, graus de liberdade = 25 

Efetue o teste Goldfeld-Quandt de heterocedasticidade no nivel de 5% de significance. 

11.22. A Tabela 11.9 apresenta dados sobre a mudanca percentual por ano para pregos de agoes (7) 
e pregos ( X) de consumo, para um corte transversal de 20 palses. 

a. Trace os dados em um diagrama de dispersao. 

b. Faga a regressao de Y contra X e examine os residuos dessa regressao. O que voce observa? 

c. Uma vez que os dados para o Chile parecem atlpicos (discrepantes?), repita a regressao 
em ( b ) excluindo os dados do Chile. Agora examine os residuos dessa regressao. O que 
se observa? 

d. Se, com base nos resultados em ( b ), conclui-se que havia heterocedasticidade na varian¬ 
cia do erro, mas com base nos resultados em (c) essa conclusao e invalidada, a que con- 
clusoes gerais voce pode chegar? 


TABELA 11.9 

Pregos das agoes e ao 
consumidor, pertodo 
pos-Segunda Guerra 
Mundial (atraves de 
1969). 

Fonte: CAGAN, Philip. 
Common stock values and 
inflation: the historical 
record of many countries. 
National Bureau of 
Economic Research, Supl., 
mar. 1974, Tabela 1, p. 4. 


Variagao anual, % 


Pregos das agoes Pregos ao consumidor 


Pals 

Y 

X 

1. Australia 

5,0 

4,3 

2. Austria 

11,1 

4,6 

3. Belgica 

3,2 

2,4 

4. Canada 

7,9 

2,4 

5. Chile 

25,5 

26,4 

6. Dinamarca 

3,8 

4,2 

7. Finlandia 

11,1 

5.5 

8. Franga 

9,9 

4,7 

9. Alemanha 

13,3 

2,2 

10. India 

1,5 

4,0 

11. Irlanda 

6,4 

4,0 

12. Israel 

8,9 

8,4 

1 3. Italia 

8,1 

3,3 

14. Japao 

13,5 

4,7 

15. Mexico 

4,7 

5,2 

16. Pafses Baixos 

7,5 

3,6 

17. Nova Zelandia 

4,7 

3,6 

18. Suecia 

8,0 

4,0 

19. Reino Unido 

7,5 

3,9 

20. Estados Unidos 

9,0 

2,1 
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11.23 A Tabela 11.10 do site apresenta dados sobre salario e dados relacionados a 447 executivos 
das 500 das melhores empresas segundo a revista Fortune. Os dados incluem salario = sala¬ 
rio e bonifica 9 oes para 1999; tot rem = remiineraqjao total do CEO para 1999; gestao = nii- 
mero de anos como CEO (0 se for menos que 6 meses); idade = idade do CEO; vendas = 
receita total de vendas da empresa para 1998; lucro = lucro para 1998 para a empresa; e ati- 
vos = ativo total da empresa em 1998. 

a. Estime a regressao a seguir desses dados e obtenha a estatfstica de Breusch-Pagan- 
-Godfrey para verificar a heterocedasticidade: 

salario,- = Pi + gestao,- P 2 + idade,- /3 3 + vendas,- p 4 + lucres,- P 5 + ativos,- /1 6 + «,- 
Parece haver um problema com a heterocedasticidade? 

b. Agora crie um segundo modelo usando o In (salario) como variavel dependente. Ha qual- 
quer aprimoramento na heterocedasticidade? 

c. Crie diagramas de dispersao do salario contra cada uma das variaveis independentes. E 
possrvel discernir qual(is) variavel(is) esta(ao) contribuindo para o problema? Que suges- 
toes poderiam ser dadas para resolver isso? Qual seria o modelo final? 


Apendice 11A 


11A.1 Prova da Equa^ao (11.2.2) 


Do Apendice 3A, Seqao 3A.3, temos 

vav(p 2 ) = E[k\u\ + k\u\ + ■ • • + k 2 n u 2 n + 2 termos de produtos cruzadosj 
= E tkfu 2 + kju 2 + • • • + k^u 2 ^ 

uma vez que as expectativas dos termos do produto cruzado sao zero, pois pressupoe-se que nao haja correlaqao serial, 

var(d2) = k\E^u\^ + k^E^u 2 ^ + ■■■ + k^E^ii 2 ^ 

visto que k t sao conhecidos. (Por que?) 

var (fii) = k\a 2 + k^a 2 + ■•■ + k^a 2 

visto que E (u 2 ) = of 

var(d 2 )= J2k?o 2 


= E 




desde que k , = 


E^ 


E ^, 2 

( e j < 2 ) 2 


( 11 . 2 . 2 ) 


11 A.2 O metodo de mmimos quadrados ponderados 


Para ilustrar o metodo, usamos o modelo de duas variaveis = di + yS 2 X, + O metodo de mmimos 
quadrados nao ponderados minimiza 

E( y '- ^ (1) 

para obtermos as estimativas, enquanto o metodo de mmimos quadrados ponderados minimiza a soma ponde- 
rada dos residuos elevados ao quadrado: 
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X] = X] MY, -Pi- Plx,) 2 (2) 

em que p\ e p 2 sao estimadores dos numeros quadrados ponderados e os pesos w,- sao tais que 

w, = ^ ( 3 ) 

isto e, os pesos sao inversamente proporcionais a variancia de ou Y t condicional ao X; dado, entendendo-se 
que var (w,-1 X,-) = var (Yj | X,) = of. 

Diferenciando a Equa§ao (2) com relajao a p\e p 2 obtemos 


9 

dPl 

dp; 


2J2MY,-Pl-P' 2 x,)(- 1 ) 

2 J2my,~ Pi - Plx.x-xo 


Igualando as expressdes anteriores a zero, obtemos as duas equa 9 oes normais a seguir: 


X mX = pl + Pi X W ' X; 

Y, w ‘ x .y = pi + p; J2 w ‘ x ? 


(4) 

(5) 


Note a semelhanga entre essas equates normais e as equates normais dos quadrados mmimos nao ponderados. 
Resolvendo essas equagoes simultaneamente, obtemos 

P\ = r- fax* (6) 


e 



(e^,)( 

Y,Wi Y i) 

( 

E w <)(E w <^) 

i - (E w >^ 



(11.3.8) = (7) 


A variancia de p 2 da Equa§ao (11.3.9) pode ser obtida tal como a variancia de p 2 do Apendice 3A, Sefao 
3A.3. 

Nota: 7* = w i 7; / E e X* = Yl w iXi / E w i■ Como se pode verificar prontamente, essas medias pon- 
deradas coincidem com as medias usuais e nao ponderadas Y e X quando w, = w, uma constante, para todo i. 


11A.3 Prova que E(o- 2 ) ^ a 2 na presen^a de 
heterocedasticidade 


Considere o modelo de duas variaveis: 

Yj = pi + P 2 Xj + Ui 


0 ) 


em que var (up = of 
Agora 


E*? E(Yi - Yi ) 2 E[P\ + PiXi + Ui - Pi - p 2 Xif 


YX-(P\- Pi)~ (Pi- Pi)x, + ujf 

n — 2 


( 2 ) 


Notando que (Pi — Pi) — — (p 2 — p 2 )X + u, e, substituindo isto na Equa<;ao (2) e subtraindo as expecta- 
tivas dos dois lados, obtemos: 
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E(cr 2 ) - ^ _ 2 { ^xfvar(ft)+ E w) 2 ]} 


1 1" ! 0- 
n~ 2\_ n J 

(3) 


em que e usada a Equagao (11.2.2). 

Como voce pode ver da Equagao (3), se ha homocedasticidade, ou seja, erf = a 2 para cada i, E(cr) = cr. Por- 
tanto, o valor esperado calculado da forma convencional a 2 = ^ u 2 /(n - 2) nao sera igual ao verdadeiro cr na 
presenga de heterocedasticidade.* 


11 A.4 Erros padrao robustos de White 


Para ter uma ideia dos erros padrao de White, corrigidos para heterocedascidade, considere o modelo de 
regressao de duas variaveis: 

Yi= P i + ft ft + Uf var («,■) = a 2 (1) 


Como mostra a Equagao (11.2.2), 


var (ft) = 


(«) 5 


( 2 ) 


Como os of nao sao diretamente observaveis, White sugere que se use uf, o resfduo elevado ao quadrado para 
cada f, em lugar de of, e calcule-se a var (ft) como se segue: 


var(ft) = 



(3) 


White mostrou que a Equagao (3) e um estimador consistente da Equagao (2), isto e, quando o tamanho da 
amostra aumenta indefinidamente, a Equagao (3) converge para a Equagao (2).f 

Por sinal, note que, se o seu software nao content procedimento de calculo do erro padrao robusto de White, 
e possfvel fazer isso como mostrado na Equagao (3), efetuando-se a regressao usual MQO, obtendo-se os resl- 
duos dessa regressao e entao usando-se a formula (3). 

O procedimento de White pode ser generalizado para o modelo de regressao com k variaveis 

Yi = P\ + P 2 X 2i + p 3 X 3i + • • • + p k X ki + Ui (4) 

A variancia de qualquer coeficiente de regressao parcial, por exemplo, ft e obtida como se segue: 


var (ft) = 



(5) 


em que n, sao os resfduos obtidos da regressao (original) (4) e ft sao os residuos obtidos da regressao (auxiliar) 
do regressor ft contra os regressores remanescentes na Equagao (4). 

Obviamente, esse e um procedimento que consome tempo, pois voce tera de estimar a Equagao (5) para cada 
variavel X. E claro que todo esse trabalho pode ser evitado se voce tiver um programa de estatfstica que faga isso. 
Programas como PC-GIVE, EViews, MICROFIT, SF1AZAM, STATA e LIMDEP agora obtem os erros padrao 
robustos para heterocedasticidade de White com facilidade. 


* Mais detalhes podem ser obtidos em KMENTA, Jan. Elements of econometrics. 2. ed. Nova York: Macmillan, 
1986. p. 276-278. 

t Para ser mais exato, n vezes a Equagao (3) converge em probabilidade para E[(X, - mx) 2 R]/( °x ) 2 , que e o limi- 
te da probabilidade de n vezes a Equagao (2), em que n e o tamanho da amostra, (i,eo valor esperado de X 
e erf e a variancia (da populagao) de X. Para mais detalhes, veja WOOLDRIDGE, Jeffrey M. Introductory 
econometrics: a modern approach. South-Western Publishing, 2000. p. 250. 











Capitulo 

Autocorrelagao: o que 
acontece se os termos de 
erro sao correlacionados? 



O leitor recordara que, de modo geral, ha tres tipos de dados disponiveis para a analise aplicada: 
(1) corte transversal; (2) series temporais; e (3) combinagoes de corte transversal e series temporais, 
conhecidos como dados combinados. Ao desenvolvermos o modelo classico de regressao linear 
(MCRL) na Parte 1, elaboramos varias hipoteses que foram examinadas na Segao 7.1. Contudo, nem 
todas essas hipoteses seriam validas para qualquer tipo de dados. Na verdade, vimos no capitulo an¬ 
terior que a hipotese da homocedasticidade, ou igual variancia do erro, nem sempre e sustentavel em 
dados de corte transversal. Em outras palavras, os dados de corte transversal muitas vezes sao afeta- 
dos pelo problema da heterocedasticidade. 

Em estudos de corte transversal os dados muitas vezes sao coletados por meio de amostras aleato- 
rias de unidades, como domicflios (para analise da fungao de consumo) ou empresas (para analise de 
estudos relativos ao investimento), de modo que nao ha razoes a priori para considerar que o termo 
de erro pertencente a um domicflio ou empresa seja correlacionado ao termo de erro de outro domicflio 
ou empresa. Se, por acaso, tal correlagao e observada nas unidades do corte transversal, ela e denomi- 
nada autocorrelagao espacial - correlagao no espago e nao ao longo do tempo. Contudo, e importan- 
te recordar que, na analise de corte transversal, o ordenamento dos dados deve ter alguma logica, ou 
interesse economico, para poder determinar se a autocorrelagao (espacial) esta ou nao presente. 

A situagao tende a ser muito diferente se estivermos lidando com series temporais, pois as obser¬ 
vagoes de tais dados seguem um ordenamento natural, de modo que observagoes sucessivas costu- 
mam apresentar intercorrelagoes, especialmente se o intervalo de tempo entre observagoes sucessivas 
for curto, como um dia, uma semana ou um mes, e nao um ano. Quando observamos indices de pre- 
gos de agoes, como o Dow Jones ou o S&P 500, durante dias sucessivos, nao e raro verificar que esses 
indices sobem ou descem por varios dias seguidos. Obviamente, em situagoes como essa, a hipotese 
de ausencia de autocorrelagao ou ausencia de correlagao serial nos termos de erro que embasa o 
modelo classico de regressao linear nao sera respeitada. 

Neste capitulo, examinaremos criticamente essa hipotese para podermos responder as seguintes 
perguntas: 

1. Qual a natureza da autocorrelagao? 

2. Quais suas consequencias teoricas e praticas? 

3. Como a hipotese da ausencia de autocorrelagao relaciona-se com os termos de erro, u„ nao 
observaveis, como saber se ela esta presente em dada situagao? Observe que agora emprega- 
mos o subscrito t para destacar que estamos lidando com series temporais. 

4. Como corrigir o problema da autocorrelagao? 
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O leitor vera que este capftulo assemelha-se, sob muitos aspectos, ao anterior, sobre heterocedas- 
ticidade, em que nas duas situates os estimadores de MQO habituais, embora lineares, nao 
tendenciosos e assintoticamente (ou seja, em grandes amostras) distribuidos de modo normal , 1 
nao mais apresentam variancia minima entre todos os estimadores lineares nao tendenciosos. 
Em resumo, eles nao sao eficientes em rela?ao a outros estimadores lineares e nao tendenciosos. Em 
outras palavras, nao sao MELNT (Melhores Estimadores Lienares Nao Tendenciosos). Em con- 
sequencia, os testes t,F ex 2 podem nao ser validos. 


12.1 A natureza do problema 

A autocorrelanao pode ser definida como “correlanao entre integrantes de series de observances 
ordenadas no tempo [como as series temporais] ou no espago [como nos dados de corte transversal]”. 2 
No contexto da regressao, o modelo classico de regressao linear pressupoe que essa autocorrelanao 
nao existe nos tennos de erro n,. Simbolicamente 


cov(tq, uj\xi, Xj) = E(UjUj ) =0 i ^ j (3.2.5) 

Em outras palavras, o modelo classico pressupoe que o termo de erro relacionado a qualquer uma 
das observances nao e influenciado pelo termo de erro de qualquer outra observanao. Por exem- 
plo, se estamos lidando com uma serie temporal trimestral para estimanao da regressao da produnao 
contra a mao de obra e o capital e se uma greve afeta a produnao de um trimestre, nao ha razao 
para acreditar que essa perturbanao prolongue-se, afetando o trimestre seguinte. Ou seja, se a 
produnao for menor neste trimestre, nao ha razao para supor que sera menor no trimestre seguinte. 
Do mesmo modo, se estamos empregando dados de corte transversal em uma regressao das despe- 
sas de uma famflia sobre a renda familiar, o efeito de um aumento da renda da familia nesses 
gastos nao devera afetar as despesas de outra familia. 

Contudo, se for verificada essa dependencia, teremos autocorrelanao. Simbolicamente, 

E(u,Uj) / 0 i ^ / (12.1.1) 

Em tal situanao, a perturbanao provocada por uma greve neste trimestre pode afetar a produnao do 
proximo, ou os aumentos da despesa de uma familia podem levar outra a aumentar seu consumo para 
nao hear para tras. 

Antes de entender por que a autocorrelanao existe, e fundamental esclarecer algumas questoes 
terminologicas. Embora hoje seja uma pratica comum tratar os termos autocorrelanao e correlanao 
serial como sinonimos, alguns autores preferem fazer distinnao entre eles. Por exemplo, Tintner de¬ 
fine autocorrelanao como “uma correlanao defasada entre determinada serie com ela mesma, com 
uma defasagem de algumas unidades de tempo”, enquanto reserva o termo correlanao serial para 
“correlanao defasada entre duas series diferentes”. 3 Assim, a correlanao entre series temporais como 
iq, u 2 , u io, e m 2 , m 3 , ..., m 11, em que a primeira e a segunda defasada em um periodo, e autocorre- 
lagdo, enquanto a correlanao entre series temporais como iq, m 2 , ..., m 10 e v 2 , V3, ... ,Vib em que 11 e v 
sao duas series temporais distintas, e chamada de correlanao serial. Embora a distinnao entre os dois 
termos possa ser util, neste livro trataremos como sinonimos. 

A Figura 12.1 apresenta alguns padroes plausiveis de presenna e de ausencia de autocorrelanao. 
As Figuras 12.1a a d mostram que ha alguns padroes discemiveis entre os u. A Figura 12.1a mostra 
um padrao ciclico; as Figuras bee sugerem tendencias lineares, ascendentes e descendentes, nos 


1 Veja GREENE, William H. Econometric analysis. 4. ed. N.J.: Prentice Hall, 2000, cap. 11; e RUDD, Paul A. An introduction 
to classical econometric theory. Oxford University Press, 2000, cap. 19. 

2 KENDALL, Maurice G.; BUCKLAND, William R. A dictionary of statistical terms. Nova York: Hafner Publishing 
Company, 1971. p.8. 

3 TINTNER, Gerhard. Econometrics. Nova York: John Wiley & Sons, 1965. 
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FIGURA 12.1 

Padroes de presenga e 
ausencia de 
autocorrelagao. 
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termos de erro; enquanto a Figura 12.1 d indica que termos de tendencia linear e quadratica estao 
presentes. Somente a Figura 12. le indica ausencia de padrao sistematico, confirmando a hipotese de 
ausencia de autocorrela 5 ao do modelo de regressao linear classico. 

A questao que se apresenta e: por que ocorre correla 9 ao serial? As razoes sao varias, e a seguir 
trataremos de algumas delas: 

Inertia 

Uma caracteristica marcante da maioria das series temporais economicas e a inercia ou lentidao. 
Como sabemos, series temporais como o PNB, os Indices de pre 50 s, a produ 5 ao, o emprego e o de- 
semprego registrant ciclos (economicos). Partindo do fundo da recessao, quando tem inicio a recupe- 
ra 9 ao economica, a maioria dessas series come 9 am a mover-se em um sentido ascendente. Nesse 
movimento, o valor da serie em um ponto do tempo e maior que o anterior. Ha um “impulso” embu- 
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tido nele que continua ate que algo aconteqa (um aumento na taxa de juros, nos impostos ou em 
ambos) para desacelera-lo. Portanto, em regressoes que envolvem series temporais, as observaqoes 
sucessivas tendem a ser interdependentes. 

Vies de especificaqao: o caso das variaveis excluidas 

Na analise aplicada, o pesquisador muitas vezes inicia com um modelo de regressao plausfvel que 
pode nao ser o mais “perfeito”. Depois, ele estuda os resultados para verificar se estao de acordo com 
as expectativas a priori. Se nao estiverem, comeqa a cirurgia. Por exemplo, o pesquisador pode fazer 
um grafico dos residuos, u h obtidos na regressao ajustada e observar padroes como os que aparecem 
na Figura 12.1. Esses residuos (que sao proxies de u,) podem sugerir que algumas variaveis origi- 
nalmente candidatas, mas que acabaram por varias razoes nao sendo incluidas no modelo, deve- 
riam entrar nele. Esse e o caso do vies de especificaqao da variavel exclui'da. Muitas vezes a 
inclusao de tais variaveis elimina o padrao de correlaqao observado entre os residuos. Por exemplo, 
suponha o seguinte modelo de demanda: 

Y t - P\ + PiXjt + PiX 2 , + p 4 X 4t + iq (12.1.2) 

em que Y — quantidade de came bovina demandada; X 2 — preqo da carne bovina; X 2 = renda do con- 
sumidor; X 4 — preqo da carne srn'na; e t — tempo. 4 Contudo, por alguma razao, estimamos a seguinte 
regressao: 


Yt - P 1 + PiXit + PiX 2t + v, (12.1.3) 

Agora, se a Equaqao (12.1.2) for o modelo “correto” ou a “verdade” ou a relaqao verdadeira, es- 
timar a Equaqao (12.1.3) equivale a fazer v, = P 4 X 4t + u, e, na medida em que o preqo da carne sulna 
afeta o consumo de carne bovina, o termo de erro, v, refletira um padrao sistematico, criando, assim, 
uma (falsa) autocorrelaqao. Um teste simples para verificar isso seria utilizar tanto a Equaqao (12.1.2) 
quanto a Equaqao (12.1.3) e ver se a autocorrelaqao observada no segundo modelo desaparece quan- 
do se estima o primeiro. 5 A mecanica efetiva para detectar a autocorrelaqao sera examinada na Seqao 
12.6, na qual mostraremos que a representaqao grafica dos residuos das regressoes (12.1.2) e (12.1.3) 
muitas vezes esclarece bastante a correlaqao serial. 

Vies de especificaqao: forma funcional incorreta 

Suponha que o modelo “verdadeiro” ou correto em um estudo de custo e produqao seja o seguinte: 

Custo marginal,- = P\ + p 2 Produqao, + P 2 Producaoy + m, (12.1.4) 

mas ajustemos o modelo 

Custo marginal, = aq + a 2 Produqao,- + v,- (12.1.5) 

A curva de custo marginal correspondente ao modelo “verdadeiro” esta na Figura 12.2 junto com a 
curva linear de custo “incorreta”. 

Como vemos na Figura 12.2, entre os pontos A e B, a curva linear de custo marginal superestima- 
ra de forma consistente o verdadeiro custo marginal, enquanto fora desses pontos ela o subestimara 
tambem de modo consistente. Esse resultado e esperado, porque o termo de erro, v„ e, de fato, igual 
a produqao 2 + m, e, portanto, estara incluindo sistematicamente o efeito do termo produqao 2 sobre o 
custo marginal. Nesse caso, v, refletira a autocorrelaqao devido ao uso de uma forma funcional incor¬ 
reta. No Capitulo 13, consideraremos varios metodos para detectar o vies de especificaqao. 


4 Por uma questao de convenqao, usaremos o subscrito t para denotar series temporais e / para dados de corte 
transversal. 

5 Se for verificado que o verdadeiro problema e o vies de especificaqao, e nao a autocorrelaqao, entao, como sera 
demonstrado no Capftulo 13, os estimadores de MQO dos parametros da Equaqao (12.1.3) poderao ser tenden- 
ciosos e inconsistentes. 
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FIGURA 12.2 

Vies de especificagao 
forma funcional 
incorreta. 


Product) 

Ofenomeno da teia de aranha 

A oferta de muitos produtos agricolas reflete o chamado fenomeno da teia de aranha, em que a 
oferta reage ao prego com a defasagem de um perfodo, porque as decisoes de oferta levam tempo para 
serem implementadas (perfodo de gestagao). No infcio do plantio da safra deste ano, os agricultores 
estao influenciados pelo prego vigente no ano anterior, de modo que sua fungao de oferta e 

Oferta, = Pi + P 2 p t -l + u t (12.1.6) 

Imagine que, no final do periodo t, o prego P, e menor que P t _ j. Portanto, no perfodo t + 1, os agri¬ 
cultores podem decidir produzir menos que em t. Obviamente, nessa situagao nao se pode esperar que 
os termos de erro w, sejam aleatorios, porque, se os agricultores produzem demais no ano t, eles ten- 
derao a reduzir a produgao em t + 1 e assim por diante, gerando o padrao da teia de aranha. 

Defasagens 

Em uma regressao de despesas sobre renda cujos dados sao series temporais, verificamos nao 
poucas vezes que as despesas do perfodo atual dependem, dentre outras coisas, das despesas do perfo¬ 
do anterior. Isto e. 



Consumo, = Pi + P 2 renda, + yS 3 Consumo,_ j + u, (12.1.7) 

Uma regressao desse tipo e conhecida como autorregressao, porque uma das variaveis explanatorias 
e o valor defasado da variavel dependente. (Examinaremos esses modelos no Capitulo 17.) A logica 
desses modelos e simples. Os consumidores nao alteram facilmente seus habitos de consumo por 
motivos psicologicos, tecnologicos ou institucionais. Agora, se negligenciarmos o termo defasado na 
Equagao (12.1.7), o termo de erro resultante refletira um padrao sistematico decorrente da influencia 
do consumo defasado sobre o consumo atual. 

“Manipulagao ” dos dados 

Na analise aplicada, os dados brutos muitas vezes sao “manipulados”. Por exemplo, em regres- 
soes de series temporais que envolvem dados trimestrais, muitas vezes os dados sao obtidos somando 
tres observagoes mensais e dividindo a soma por tres. Essas medias suavizam os dados amenizando 
as flutuagoes dos dados mensais. Portanto, a representagao grafica dos dados trimestrais e muito me¬ 
nos irregular que a dos dados mensais e essa mesma regularidade pode gerar um padrao sistematico nos 
termos de erro, introduzindo a autocorrelagao. Outra fonte de manipulagao e a interpolagao ou a 
extrapolagao de dados. Por exemplo, nos Estados Unidos, o Censo Demografico e realizado a cada 
dez anos, o mais recente e o de 2000 e o anterior foi em 1990. Agora, se houver necessidade de obter 
dados para algum ano no perfodo intercensitario 1990-2000, a pratica comum e fazer a interpolagao 




420 


Parte Dois Relaxamento das hipoteses do modelo classico 


com base em algum pressuposto ad hoc. Todas essas tecnicas de “massagem” dos dados impoem a 
eles um padrao sistematico que pode nao existir nos dados originais. 6 

Transformagao de dados 

Como exemplo, considere o seguinte modelo: 

Y, = + faX, + u, (12.1.8) 

em que Y = despesas e X = renda. Como a Equagao (12.1.8) aplica-se em todos os perfodos, isso e 
valido tambem no perfodo anterior, (1 — 1). Podemos escrever a Equagao (12.1.8) como 


Yt -1 - Pi + faXt-i + u t -1 (12.1.9) 

Y t _ h X,_ | e u,_ | sao conhecidos como os valores defasados de Y, X e u, respectivamente, aqui de- 
fasado em um perfodo. Veremos a importancia dos valores defasados mais adiante neste capltulo, bem 
como em diversas partes do livro. 

Agora, se subtrairmos a Equagao (12.1.9) da Equagao (12.1.8), obteremos 

AF, = p 2 AX t + Am, (12.1.10) 

em que A, conhecido como operador de primeira diferenga, indica que devemos tomar sucessivas 
diferengas das variaveis em questao. Assim, A Y, = (Y, — Y t - 1 ), AX, = ( X t - X t -\), e A u, = 
( u , — u,_ |). Para fins praticos, escrevemos a Equaqao (12.1.10) como 

AY, = PiAXt + v t (12.1.11) 


em que v, = Au, — ( u, — u,_ j). 

Equagao (12.1.9) e conhecida como forma de nivel e a Equagao (12.1.10) e conhecida como a 
forma de (primeira) diferenga. Ambas sao frequentemente utilizadas na analise aplicada. Por exem¬ 
plo, se na Equagao (12.1.9) Y e X representam os logaritmos das despesas de consumo e renda, entao, 
na Equagao (12.1.10) Abe AX representarao mudangas nos logaritmos das despesas de consumo e 
renda. Como sabemos, uma alteragao no logaritmo de uma variavel e uma mudanga relativa ou uma 
variagao percentual se a primeira e multiplicada por 100. Em vez de estudarmos as relagoes entre as 
variaveis da forma de rnvel, podemos concentrar-nos em suas relagoes na forma de crescimento. 

Se o tenno de erro na Equagao (12.1.8) satisfizer as hipoteses padrao dos MQO, principalmente a 
de ausencia de autocorrelagao, e possrvel provar que o termo de erro v, na Equagao (12.1.11) e auto- 
correlacionado. (Veja o Apendice 12A, Segao 12A.1.) Pode-se notar aqui que modelos similares a 
Equagao (12.1.11) sao conhecidos como modelos de regressao dinamicos, modelos que envolvem 
regressandos defasados. Estudaremos esses modelos de forma aprofundada no Capltulo 17. 

O sentido do exemplo anterior e que, as vezes, a autocorrelagao pode ser induzida como um re- 
sultado da transformagao do modelo original. 

Ausencia de estacionariedade 

Mencionamos no Capltulo 1 que, ao lidarmos com series temporais, podemos ter a necessidade 
de descobrir se alguma delas e estacionaria. Embora tratemos do topico das series temporais nao es- 
tacionarias em mais detalhes nos capltulos sobre econometria de series temporais na Parte 5 do livro, 
em termos gerais, uma serie temporal e estacionaria se suas caracteristicas (por exemplo, a media, 
variancia e covariancia) nao variam ao longo do tempo. Se esse nao for o caso, temos uma serie nao 
estacionaria. 


6 Veja GREENE, William H. op. cit., p. 526. 
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Como veremos na Parte 5, em um modelo de regressao, como a Equagao (12.1.8), e perfeitamen- 
te possfvel que tanto Y quanto X sejam nao estacionarios e, portanto, o erro, u, tambem seja nao esta- 
cionario. * * * * * * 7 Nesse caso, o termo de erro apresentara autocorrelagao. 

Em sfntese, ha varias razoes pelas quais o termo de erro em um modelo de regressao pode ser 
autocorrelacionado. No restante do capftulo, procuraremos investigar com alguns detalhes os proble- 
mas provocados pela autocorrelagao e o que pode ser feito para serem resolvidos. 

Convem notar tambem que a autocorrelagao pode ser tanto positiva (Figura 12.3a) quanto nega- 
tiva, embora a maior parte das series temporais economicas em geral apresente autocorrelagao 
positiva, pois, em sua maioria, evolui para cima ou para baixo por longos periodos e nao apresenta 
oscilagoes constantes, tais como a da Figura 12.3b. 

FIGURA 12.3 

Autocorrelagao 
positiva (a) e 
negativa ( b ). 
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12.2 Estimativa de MQO na presen^a de autocorrelagao 

O que acontecera aos estimadores de MQO e suas variancias se introduzirmos autocorrelagao nos 

termos de erro, supondo que E(u,u, + j ^ 0 (.v A 0), mas mantivermos todas as outras hipoteses do 

modelo classico? 8 Observe novamente que estamos usando agora o subscrito t nos termos de erro 

para destacar que lidamos com series temporais. 

Voltemos ao modelo de regressao de duas variaveis para explicar as ideias basicas envolvidas, a 

saber, Y, — /3j + fi 2 X, + u,. Para avangar, precisamos imaginar que o mecanismo que gera u, para 


7 Como veremos na Parte 5, mesmo que Y e X nao sejam estacionarios, e possfvel que u seja. Exploraremos as 
implicates de tal situagao mais adiante. 

8 Se s = 0, obtemos £(u 7 ). Como £(u t ) = 0 por hipotese, E(uf) representa a variancia do termo de erro, o que ob- 
viamente e diferente de zero (por que?). 
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E(u,u t+ s ) p 0 (.v i=- 0) e um pressuposto demasiado geral para ter utilidade pratica. Como ponto de 
partida ou primeira aproximagao, podemos supor que os termos de erro sao gerados pelo seguinte 
mecanismo: 


u, = pu t - \ + e, — 1 < p < 1 ( 12 . 2 . 1 ) 

em que p e conhecido como coeficiente de autocovariancia e e, e o termo de erro estocastico, tal que 
atenda a hipotese padrao dos MQO: 

E(s t ) = 0 

var (e,) = of ( 12 . 2 . 2 ) 

cov(e,, £ r+i ) =0 s / 0 

Na literatura de engenharia, um termo de erro com as propriedades anteriores e frequentemente 
chamado de ruido branco ( white noise). O que a Equagao (12.2.1) postula e que o valor do termo de 
erro no perfodo t e igual a p vezes o seu valor no perfodo anterior, acrescido de um termo de erro 
puramente aleatorio. 

O esquema (12.2.1) e conhecido como processo autorregressivo de primeira ordem de Markov 
ou, simplesmente, processo autorregressivo de primeira ordem, normalmente designado como AR 
(1). A denominagao autorregressivo e adequada, porque a Equagao (12.2.1) pode ser interpretada 
como a regressao de u, na sua propria defasagem de um perfodo. Trata-se de primeira ordem, porque 
it, e o valor imediatamente anterior estao envoividos; a defasagem maxima e 1. Se o modelo fosse u, 
= P\ii ,-1 + P 2 U t _ 2 + £,, seria um AR (2), ou processo autorregressivo de segunda ordem e assim por 
diante. Iremos analisar esses processos de ordem mais elevadas nos capftulos sobre econometria de 
series temporais na Parte 5. 

Vale mencionar que p, coeficiente de autocovariancia na Equagao (12.2.1), tambem pode ser 
interpretado como o coeficiente de autocorrelagao de primeira ordem, ou mais precisamente, o 
coeficiente de autocorrelagao de defasagem l. 9 

Dado o processo AR(1), pode-se demonstrar que (veja o Apendice 12A, Segao 12A.2): 


(7 ^ 

var (u,) = E(u 2 t ) = * 

1 — yO Z 

(12.2.3) 

a: 


COv(u t ,u t +s)- E(u t U t - s ) - p 

1 - p z 

(12.2.4) 

cor (u t , u, +s ) = p s 

(12.2.5) 


em que co v(m,, u t+s ) representa a covariancia entre termos de erro separados por s perfodos e 
cor(«„ u, +s ) e a correlagao entre termos de erro separados por ,v periodos. Note que, devido a propriedade 
de simetria das covariancias e correlagoes, cov(«,, u t+s ) = cov(u„ u,_ s ) e cor(u,, u , +s ) = cor(«,, u,_ s ). 


9 Esta denominagao pode ser facilmente justificada. Por definigao, o coeficiente (populacional) de correlagao entre 
Uf e u t _i e 


E{[u t - E(u t )][u t -1 - E (c/f— i)]} 
yvarCudVvarfut-!) 


E(utut-i) 
var (t/f -|) 


uma vez que E(u t ) = 0 para cada t e var(u t ) = var(porque estamos mantendo a hipotese de homocedasti- 
cidade. O leitor pode ver que p e tambem o coeficiente angular de regressao de u, contra var( u t _i). 
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Como p e uma constante com valor entre —1 e +1, a Equagao (12.2.3) mostra que, sob o proces- 
so AR( 1), a variancia de u, ainda e homoceddstica, mas u, esta correlacionado nao so com o seu valor 
passado imediato, mas tambem com os valores de varios perfodos atras. E fundamental salientar que 
\p\ < 1, ou seja, o valor absoluto de p e inferior a 1. Se, por exemplo, p for 1, as variancias e covarian- 
cias listadas nao estarao definidas. Se \p\ < 1, dizemos que o processo AR(1) dado na Cquayao 
(12.2.1) e estacionario\ a media, variancia e covariancia de u, nao variam ao longo do tempo. Se | p\ 
for inferior a 1, e evidente pela Equa?ao (12.2.4) que o valor da covariancia diminuira a medida que 
retrocedermos ao passado distante. Veremos a utilidade dos resultados anteriores em breve. 

Uma razao para usar o processo AR( 1) nao esta apenas em sua simplicidade em compara 9 ao com 
processos AR de ordem mais elevada, mas tambem porque, em muitas aplicagoes, tem sido bastante 
util. Alem disso, uma quantidade consideravel de trabalhos teoricos e praticos ja foram feitos usando 
o processo AR(1). 

Agora retomaremos ao nosso modelo de regressao de duas variaveis: Y, = + (iiX, + iq.Vimos 

no Capitulo 3 que o estimador do coeficiente angular obtido pelo metodo dos MQO e: 

V x t Vt 

fh = (12.2.6) 

e sua variancia e dada por: 


var(/j 2 ) = 



(12.2.7) 


em que as letras minusculas, como de costume, denotam desvios em relagao a media. 
Agora sob o processo AR(1), podemos demonstrar que a variancia deste estimador e: 


var(y6 2 )ARi = 


EV 


1 + 2 p 


E x t x t- 

E^ 2 


1 ^ 2 x t x t— 2 


+ 2 p l 


E*r 2 


■ + 2 p 


n -l X\X n 


EE 


( 12 . 2 . 8 ) 


em que var (/S 2 ) AR1 significa a variancia de /1 2 sob um processo autorregressivo de primeira ordem. 

Uma comparacjao da Equa 9 ao (12.2.8) com a Equaijao (12.2.7) mostra que a primeira e igual a 
segunda multiplicada por um termo que depende de p, bem como das autocorrela 5 oes amostrais entre 
os valores assumidos pelo regressor X com varias defasagens. 10 E, em geral, nao podemos dizer se 
var (J> 2 ) e menor ou maior que var (/J 2 ) AR | (veja a Equa 9 ao (12.4.1)). Obviamente, se p for igual a 
zero, as duas formulas coincidirao (por que?). Alem disso, se as correla 9 oes entre os valores sucessi- 
vos do regressor forem muito pequenas, a variancia habitual do estimador angular calculado segundo 
o metodo dos MQO nao sera seriamente tendenciosa. Mas, como princfpio geral, as duas variancias 
nao serao iguais. 

Para uma ideia sobre a diferen 9 a entre as variancias das Equa 9 oes (12.2.7) e (12.2.8), suponha que 
o regressor X tambem siga o esquema autorregressivo de primeira ordem, com um coeficiente de 
autocorrela 9 ao de r. Entao, podemos demonstrar que a Equa 9 ao (12.2.8) reduz-se a: 

var (/3 2 )ari = = var( j 6 2 ) MQ o^ | ^ ^ j (12.2.9) 


Se por exemplo, r — 0,6 e p — 0,8, empregando a Equa 9 ao (12.2.9) podemos verificar que 
var 0 2 )ari = 2,8461 var 0 2 )mqo- Em outras palavras, var( y 6 2 ) M Qo > = 2 ^ 6 l var (^ 2 )ARi = 0,3513 
var (/6 2 )ari- A formula de MQO (12.2.7) subestimara a variancia de (/S 2 )ari em cerca de 65%. Como 
vocepercebera, essarespostaeespecificaparadeterminado valord ere p. Entretanto, oimportanteneste 
exercicio e mostrar que uma aplica 9 ao cega das formulas habituais de MQO para calcular as variancias 
e erros padrao dos estimadores de MQO poderia conduzir a resultados profundamente equivocados. 


10 Observe que o termo r = x t x t+ 1 / Y x t & a correlagao entre X t eX 1+1 (ou X t _^, ja que o coeficiente de corre- 
lagao e simetrico); r 2 = Y x t x t+ 2 / Y x t ® a correlajao entre os X defasados de dois perfodos e assim por diante. 















424 Parte Dois Relaxamento das hipoteses do modelo classico 


Suponhamos que continuemos empregando o estimador de MQO, P 2 , e que ajustemos a variancia 
habitual levando em conta o processo AR( 1). Ou seja, empregamos p 2 da Equagao (12.2.6), mas usa- 
mos a formula de variancia da Equagao (12.2.8). Quais sao, agora, as propriedades de /if? E facil 
provar que p 2 ainda e linear e nao tendencioso. De fato, como mostra o Apendice 3A, Segao 3A.2, a 
hipotese de ausencia de correlagao serial, como a ausencia de heterocedasticidade, nao e exigida para 
provar que p 2 e nao tendencioso. Mas, sera que p 2 ainda e MELNT? Infelizmente, nao; na classe de 
estimadores lineares nao tendenciosos, ele nao tem variancia minima. Em suma, P 2 , embora linear e nao 
tendencioso, nao e eficiente (em termos relativos). O leitor notara que esse resultado e bastante semelhan- 
te a conclusao de que p 2 e menos eficiente na presenga de heterocedasticidade. Vimos que o estimador de 
mmimos quadrados ponderados p 2 , da Equagao (11.3.8), e um caso especial de estimador de mlnimos 
quadrados generalizados (MQG), que se mostrou eficiente. No caso de autocorrelagao podemos encon- 
trar um estimador que seja MELNT? A resposta e sim, como pode ser visto na segao seguinte. 


12.3 O estimador BLUE na presenga de autocorrelagao 

Continuando com o modelo de duas variaveis e supondo o processo AR(1), podemos mostrar que 
o estimador BLUE de p 2 e fornecido pela seguinte expressao: 11 


,5mqg E l= 2 ( x t- px,-i)(y,- pyt-i) , „ 

°2 = - , -LT- + C 

l^t=l\ x t ~ PXt-lY 


(12.3.1) 


em que C e um fator de corregao que pode ser desconsiderado na pratica. Observe que o subscrito t 
agora se estende def=2af = ne sua variancia e dada por: 


var^ QG = 


Y,"=i(xt - PX, i ) 2 


+ D 


(12.3.2) 


em que D tambem e um fator de corregao que pode ser desconsiderado na pratica. (Veja o Exercicio 
12.18). 

O estimador como sugere o sobrescrito, e obtido pelo metodo MQG. Como mencionado 

no Capitulo 11, em MQG incorporamos qualquer informagao adicional disponivel (por exemplo, a 
natureza da heterocedasticidade ou da autocorrelagao) diretamente no processo de estimagao median- 
te a transformagao de variaveis, enquanto no metodo dos MQO, essas informagoes nao sao levadas em 
conta diretamente. Como o leitor pode ver, o estimador de GLS P 2 dado na Equagao (12.3.1) incor¬ 
pora o parametro de autocorrelagao p a formula de estimagao, enquanto a formula de MQO da Equa¬ 
gao (12.2.6) apenas o ignora. De maneira intuitiva, essa e a razao pela qual o estimador de MQG e 
BLUE e nao o estimador de MQO; o estimador de MQG aproveita mais as informagoes disponiveis. 12 
Nem e tao importante acrescentar que, se p — 0, nao existe qualquer informagao adicional a ser consi- 
derada e, por conseguinte, tanto os estimadores de MQG quanto os de MQO sao identicos. 

Em suma, com a autocorrelagao, e o estimador da Equagao (12.3.1) que e BLUE, e a variancia 
minima e dada agora pela Equagao (12.3.2) e nao pela (12.2.8) e, obviamente, nao pela Equagao 
(12.2.7). 


11 Uma demonstragao e encontrada em KMENTA, Jan. Elements of econometrics. Nova York: Macmillan, 1971, 
p. 274-275. O fator de corregao C pertence a primeira observagao, (Y^ X,). Sobre esse ponto, veja o Exercicio 
12.18. 

12 A demonstragao formal de que a /j)" 30 e BLUE pode ser encontrada em KMENTA, ibid, mas a cansativa de- 
monstragao algebrica pode ser consideravelmente simplificada usando a notagao matricial. Veja JOHNSTON, J. 
Econometric methods. 3. ed. Nova York: McGraw-Hill, 1984. p. 291-293. 
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Uma observagao tecnica 

Como ja salientado no capftulo anterior, o teorema de Gauss-Markov fornece apenas a condigao 
suficiente para que o MQO seja MELNT. As condigoes necessarias e suficientes para tanto estao no 
teorema de Kruskal, mencionado no capftulo anterior. Em alguns casos, pode ocorrer de MQO ser 
MELNT, apesar da autocorrelagao. Na pratica esses casos sao pouco frequentes. 

O que acontece se insistirmos em trabalhar com os procedimentos habituais de MQO, apesar da 
autocorrelagao? A resposta e dada na proxima segao. 


12.4 Consequencias do uso dos MQO na presen^a de autocorrelagao 


Como no caso da heterocedasticidade, na presenga de autocorrelagao, os estimadores de MQO 
ainda sao lineares e nao tendenciosos, bem como consistentes e com distribuigao normal assintotica, 
mas deixam de ser eficientes (de ter variancia minima). O que acontece entao com os procedimentos 
habituais de teste de hipoteses se continuarmos a utilizar os estimadores de MQO? Novamente, como 
no caso de heterocedasticidade, distinguimos duas situagao. Por questoes pedagogicas, continuare- 
mos trabalhando com o modelo de duas variaveis, embora o exame a seguir possa ser estendido a 
regressao multipla sem muita complicagao. 13 

Estimagao por meio de MQO considerando a autocorrelagao 

Como se observa, fi 2 nao e MELNT, e mesmo empregando a var (/LIari- os intervalos de confian- 
ga obtidos a partir daf sao suscetfveis de serem mais amplos do que os baseados no procedimento dos 
MQG. Como mostra Kmenta, e provavel que este seja o caso, mesmo que o tamanho da amostra 
aumente indefinidamente. 14 Isto e, fi 2 nao e assintoticamente eficiente. A implicagao dessa constata- 
gao para o teste de hipotese e clara: estamos propensos a declarar que um coeficiente e estatisticamente 
insignificante (nao diferente de zero), embora na realidade (com base no procedimento correto 
de MQG) possa nao ser. Essa diferenga pode ser vista na Figura 12.4. Nela mostramos os intervalos de 
confianga de 95% calculados segundo os MQO [AR(l)j e os MQG, supondo que o verdadeiro f$ 2 — 0. 
Considere determinada estimativa de /b, por exemplo, b 2 - Como b 2 encontra-se no intervalo de con¬ 
fianga de MQO, poderiamos aceitar a hipotese de que o verdadeiro /S 2 seja zero com 95% de confian¬ 
ga. Mas, se tivessemos de utilizar o intervalo de confianga de MQG (correto), poderiamos rejeitar a 
hipotese nula de que o verdadeiro ft 2 e igual a zero, pois b 2 esta na area de rejeigao. 

Amensagem e: para estabelecermos intervalos de confianga e testar hipoteses, devemos usar 
os MQG e nao os MQO, mesmo que os estimadores obtidos por estes ultimos sejam nao tenden¬ 
ciosos e consistentes. (No entanto, convem consultar a Segao 12.11 posteriormente.) 

Estimagao por meio de MQO nao considerando a autocorrelagao 

A situagao toma-se potencialmente muito grave se, alem de nao utlilizarmos P 2 , tambem continua- 
mos a usar var(/b) = cr 2 / xj, que ignora por completo o problema da autocorrelagao. Em outras 


FIGURA 12.4 

Intervalos de 
confianga de 95% 
dados pelos MQG e 
pelos MQO. 



Intervalo de confianga de 95% dado pelos MQG 


Intervalo de confianga de 95% dado pelos MQO 


13 Mas a algebra matricial torna-se quase uma necessidade para evitar manipulagoes algebricas tediosas. 

14 Veja KMENTA, op. cit., p. 277-278. 
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palavras, se acreditarmos erroneamente que as hipoteses habituais do modelo classico mantem-se 
validas. Os erros surgirao pelas seguintes razoes: 

1. A variancia residual a 1 - /(n - 2) provavelmente subestimara o verdadeiro er. 

2. Como resultado, seremos levados a superestimar R 2 . 

3. Mesmo que a 2 nao esteja subestimado, a var (/3 2 ) pode subestimar a var (/i 2 ) AR1 (Equa£ao 
(12.2.8)), sua variancia sob a autocorrela 5 ao (de primeira ordem), embora esta ultima seja 
ineficiente em compara 5 ao com a var (j3 2 ) M Q G . 

4. Por isso, os testes comuns de significancia t e F deixam de ser validos e, se aplicados, prova¬ 
velmente nos levarao a conclusoes extremamente equivocadas sobre a significancia estatistica 
dos coeficientes de regressao estimados. 

Para demonstrarmos algumas dessas propos^oes, voltemos ao modelo de duas variaveis. Ja vi- 
mos no Capitulo 3 que, sob a hipotese classica, 



in- 2 ) 


fornece um estimador nao tendencioso de er 2 , isto e, E(a 2 ) — a 2 . Mas, se houver autocorrela§ao, dada 
por AR(1), podemos demonstrar que: 

E(a 2 ) = ^"-[2/a-p)]-2pr} (12.4.1) 

n— 2 

em que r = Yi!t =1 x t x t -1 / Y^= t x u que pode ser interpretado como o coeficiente de correlagao (amos- 
tral) entre os valores sucessivos dos X. 15 Se p e r forem ambos positivos (o que nao e improvavel para 
a maioria das series temporais economicas), evidencia-se, pela Equa?ao (12.4.1), que E(a 2 ) < er; a 
formula habitual da variancia residual, em media, subestimara o verdadeiro a 2 . Em outras palavras, er 
tera um vies descendente. Desnecessario dizer que esse vies do er 2 sera transmitido a var (/J 2 ), porque, 
na pratica, estimamos esta ultima por meio da formulas er 2 / x 2 . 

Mas mesmo que a 2 nao seja subestimado, a var (j> 2 ) e um estimador tendencioso da var (ft 2 ) AR1 , 
o que pode ser facilmente visto comparando-se a Equagao (12.2.7) com a (12.2.8), 16 ja que as duas 
formulas nao sao iguais. Na verdade, se p e positivo (o que e verdadeiro na maioria das series tempo¬ 
rais economicas) e se os X forem positivamente correlacionados (tambem verdadeiro na maioria das 
series temporais economicas), entao e claro que, 

var(/i 2 ) < var( / S 2 ) AR i (12.4.2) 


ou seja, a variancia de j3 2 calculado por MQO subestima sua variancia calculada sob AR (1) (veja a 
Equa?ao (12.2.9)). Se usarmos var (/) 2 ), estaremos inflando a precisao ou exatidao (subestimaremos o 
erro padrao) do estimador /J 2 . Como resultado, ao calcularmos a razao t como t = /S 2 /ep (J> 2 ) (sob a 
hipotese de que fi 2 = 0), estaremos superestimando o valor t e, portanto, a significancia estatistica do 
( J > 2 estimado. A situa 5 ao tende a piorar se, alem disso, cr 2 for subestimado, como mencionado anterior- 
mente. 

Para ver como o metodo dos MQO tende a subestimar a 2 e a variancia de /i 2 , vamos realizar o 
experimento de Monte Carlo a seguir. Suponha que “saibamos” que, no modelo com duas varia¬ 
veis, o verdadeiro = 1 e fi 2 = 0,8. Por isso, a FRP estocastica e: 

Y, = 1,0+ 0,8X, + u t (12.4.3) 


15 VerGoldfeld, S. M.; Quandt, R. E. Nonlinear methods in econometrics. Amsterda: North Holland Publishing Company, 
1972, p. 183. Note que, se os erros estao positivamente autocorrelacionados, o valor de R 2 tende a apresentar 
vies ascendente, isto e, tende a ser maior do que o ft 2 , na ausencia de tal correlagao. 

16 Lima demonstragao formal e encontrada em KMENTA, op.cit., p. 281. 
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Assim, 


E(Y, \X t ) = 1,0 + 0,8A, (12.4.4) 

que nos da a verdadeira linha de regressao populacional. Supondo que os u, sejam gerados pelo pro- 
cesso autorregressivo de primeira ordem como: 

U( = 0,7u t -\ + s t (12.4.5) 

em que s, satisfaz todas as hipoteses dos MQO. Imagine ainda, por conveniencia, que s, distribui-se 
normalmente com media zero e variancia unitaria (= 1). A Equa 9 ao (12.4.5) postula que os termos de 


TABELA 12.1 


fit 

u t = 0.7ut_i + e t 

Exemplo hipotetico 
de termos de erro 

correlacionados de 
modo positivo 

0 

1 

0 

0,464 

Uo - 5 (valor inicial assumido) 

= 0,7(5) + 0,464 = 3,964 

2 

3 

2,026 

2,455 

u 2 = 0,7(3,964)+ 2,0262 = 4,8008 
u 3 = 0,7(4,8010)+ 2,455 = 5,8157 


4 

-0,323 

u 4 = 0,7(5,8157)- 0,323 = 3,7480 


5 

-0,068 

u 5 = 0,7(3,7480)- 0,068 = 2,5556 


6 

0,296 

u 6 = 0,7(2,5556)+ 0,296 = 2,0849 


7 

-0,288 

u 7 = 0,7(2,0849)- 0,288 = 1,1714 


8 

1,298 

u 8 = 0,7(1,1714)+ 1,298 = 2,1180 


9 

0,241 

Ug = 0,7(2,1180) + 0,241 = 1,7236 


10 

-0,957 

iqo = 0,7(1,7236)- 0,957 = 0,2495 


Nota: extraido de A million rcimdom digits and one hundred thousand desviates. Santa Monica, Calif.: 
Rand Corporation, 1950. 


FIGURA 12.5 

Correlaijao gerada 
pelo processo u, = 

0 + s t 

(Tabela 12.1). 
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erro sucessivos estao positivamente correlacionados com um coeficiente de autocorrelapao de +0,7, 
um grau de dependencia bastante alto. 

Agora, usando uma tabela de numeros aleatorios normals com media zero e variancia unitaria, 
geramos os 10 numeros aleatorios apresentados na Tabela 12.1 e, em seguida, pelo processo (12.4.5) 
e criado u t . Para comepar, e necessario especificar o valor inicial de u, por exemplo, u Q = 5. 

Tra£ando o u, gerado na Tabela 12.1, obtemos aFigura 12.5, o que mostra que, inicialmente, cada 
u, sucessivo e mais alto que seus valores anteriores e, posteriormente, em geral e menor do que seus 
valores anteriores, indicando, geralmente, uma autocorrelagao positiva. 

Agora suponha que os valores dos X sejam fixados em 1, 2, 3,..., 10. De acordo com esses X, po- 
demos gerar uma amostra de 10 valores de Y com base na Equa§ao (12.4.3) e dos valores de u, apre¬ 
sentados na Tabela 12.1. Os detalhes estao na Tabela 12.2. Usando os dados da Tabela 12.2, se 
fizermos a regressao de Y contra X, obteremos a seguinte regressao (amostral): 

Y, = 6,5452 + 0,3051 A, 

(0,6153) (0,0992) 

(12.4.6) 

t= (10,6366) (3,0763) 

r 2 = 0,5419 <x 2 = 0,8114 


TABELA 12.2 

Geracao de Y valores 
amostrais 



Wt 

Y t = 

1,0 + 0,8Xf + Ut 

1 

3,9640 

Ki = 

1,0 + 0,8(1) + 3,9640 = 5,7640 

2 

4,8010 

y 2 = 

1,0+ 0,8(2) + 4,8008= 7,4008 

3 

5,8157 

Pb = 

1,0 + 0,8(3) + 5,8157 = 9,2157 

4 

3,7480 

y 4 = 

1,0 + 0,8(4) + 3,7480 = 7,9480 

5 

2,5556 

Ys = 

1,0 + 0,8(5) + 2,5556 = 7,5556 

6 

2,0849 

y 6 = 

1,0+ 0,8(6) + 2,0849= 7,8849 

7 

1,1714 

y 7 = 

1,0 + 0,8(7) + 1,1714 = 7,7714 

8 

2,1180 

y 8 = 

1,0 + 0,8(8) + 2,1180 = 9,5180 

9 

1,7236 

Yg = 

1,0 + 0,8(9) + 1,7236 = 9,9236 

10 

0,2495 

Y-\o = 

1,0 + 0,8(10) + 0,2495 = 9,2495 


Nota: elaborado com base na Tabela 12.1. 


FIGURA 12.6 

A verdadeira FRP e a 
linha de regressao 
estimada para os 
dados da Tabela 12.2. 


Y 
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A verdadeira linha de regressao e dada pela Equa^ao (12.4.4). Ambas as linhas de regressao aparecem 
na Figura 12.6, o que mostra claramente quanto a linha de regressao ajustada distorce a verdadeira 
linha de regressao; ela subestima significativamente o verdadeira coeficiente angular, mas superestima 
o verdadeira intercepto (Observe que, ainda assim, os estimadores de MQO sao nao tendenciosos.) 

A Figura 12.6 tambem mostra a razao pela qual a verdadeira variancia de u, tende a ser subesti- 
mada pelo estimador a 2 , que e calculada a partir de u r Os ii, geralmente estao proximos da linha 
ajustada (devido ao procedimento dos MQO), mas desviam-se substancialmente da verdadeira FRP. 
Eles nao apresentam uma imagem correta de t/,. Para entender melhor a extensao da subestimaqiao do 
verdadeira cr 2 , suponha outro experimento de amostragem. Com os X, e os s, apresentados nas Tabelas 
12.1 e 12.2, imaginemos que p = 0, ou seja, nenhuma autocorrela£ao. A nova amostra de valores de Y 
esta na Tabela 12.3. 

A regressao com base na Tabela 12.3 e a seguinte: 

Y, = 2,5345 + 0,6145X, 

(0,6796) (0,1087) 

t = (3,7910) (5,6541) 

r 2 = 0,7997 


(12.4.7) 


= 0,9752 


TABELA 12.3 

Amostra de valores de 
Y com correla§ao 
serial igual a zero 



s t = u t 

/, = 1,0 + 0,8X t + st 

1 

0,464 

2,264 

2 

2,026 

4,626 

3 

2,455 

5,855 

4 

-0,323 

3,877 

5 

-0,068 

4,932 

6 

0,296 

6,096 

7 

-0,288 

6,312 

8 

1,298 

8,698 

9 

0,241 

8,441 

10 

-0,957 

8,043 


Nota: uma vez que nao ha autocorrelagao, u t e e, sao identicos. Os s t sao os da 
Tabela 12.1. 


Essa regressao aproxima-se muito mais da “verdadeira”, porque agora os Y sao essencialmente 
aleatorios. Observe que a 1 aumentou de 0,8114 (p = 0,7) para 0,9752 (p = 0). Tambem observe que 
os erros padrao de e /T aumentaram. Esse resultado esta de acordo com os resultados teoricos con- 
siderados anteriormente. 


12.5 Rela^ao entre salarios e produtividade no setor empresarial dos 
Estados Unidos, 1960-2005 

Agora que ja examinamos as consequencias da autocorrela 5 ao, a pergunta obvia e: como pode- 
mos detecta-la e corrigi-la? Antes de tratarmos desses topicos, e util considerar um exemplo concreto. 
A Tabela 12.4 apresenta dados relativos a indices de remuneragao real por hora (Y) e produ 5 ao por 
hora (X) no setor empresarial da economia norte-americana, referentes ao periodo 1960-2005; a base 
dos Indices e 1992 = 100. 

Na Figura 12.7, temos a representacjao grafica dos dados em Y e X. Como se espera que a rela^ao 
entre remuneragao real e produtividade da mao de obra seja positiva, nao surpreende que as duas 
variaveis apresentem relagao positiva. O que surpreende e que a relagao entre as duas e quase linear, 
embora haja alguns indfcios de que, quando os valores da produtividade sao mais elevados, a rela 5 ao 
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entre as variaveis torna-se ligeiramente nao linear. Portanto, decidimos estimar um modelo linear e 
outro log-linear com os seguintes resultados: 


% = 32,7419 + 0,6704X ; 

ep = (1,3940) (0,0157) 

t= (23,4874) (42,7813) 

r 2 = 0,9765 d = 0,1739 <r = 2,3845 

em que d e a estatistica de Durbin-Watson, que examinaremos adiante. 

In J t = 1,6067 + 0,6522 In X, 

ep= (0,0547) (0,0124) 

t= (29,3680) (52,7996) 

r 2 = 0,9845 d= 0,2176 a = 0,0221 


(12.5.1) 


(12.5.2) 


Uma vez que esse modelo e double-log, o coeficiente angular representa a elasticidade. Neste caso, 
vemos que, se a produtividade do trabalho aumenta 1%, a remuneratjao media aumenta cerca de 0,65%. 

Qualitativamente, ambos os modelos apresentam resultados semelhantes. Nos dois casos, os coe- 
ficientes estimados sao “altamente” significativos, como indicado pelos valores elevados de t. No 
modelo linear, se o mdice de produtividade aumenta em uma unidade, o mdice de remunera 5 ao sobe, 
em media, 0,67 unidades. No modelo logaritmico, como o coeficiente angular e a elasticidade (por 
que?), verificamos que, se o indice de produtividade aumenta 1% o indice de remunera 9 ao real au¬ 
menta, em media, 0,65%. 

Ate que ponto os resultados apresentados nas Equa 9 oes (12.5.1) e (12.5.2) sao confiaveis se ha 
autocorrelaqiao? Como afirmado anteriormente, se ha autocorrelatjao, os erros padrao estimados sao 
tendenciosos, e, como consequencia, as razoes t estimadas nao sao confiaveis. Obviamente, precisa- 
mos detectar se nossos dados sao autocorrelacionados. Na seqiao seguinte, examinaremos varios me- 
todos de detecgao da autocorrela£ao e ilustraremos com o modelo log-linear (12.5.2). 


TABELA 12.4 

Indices de 

remunerafao real e de 
produtividade, 
1960-2005 (Indice de 
numeros, 1992 = 

100, dados trimestrais 
sazonais ajustados) 

Fonte: Economic Report of 
the President, 2007, Tabela 
B - 49 


Ano 


X 

Ano 

Y 

X 

1960 

60,8 

48,9 

1983 

90,3 

83,0 

1961 

62,5 

50,6 

1984 

90,7 

85,2 

1962 

64,6 

52,9 

1985 

92,0 

87,1 

1963 

66,1 

55,0 

1986 

94,9 

89,7 

1964 

67,7 

56,8 

1987 

95,2 

90,1 

1965 

69,1 

58,8 

1988 

96,5 

91,5 

1966 

71,7 

61,2 

1989 

95,0 

92,4 

1967 

73,5 

62,5 

1990 

96,2 

94,4 

1968 

76,2 

64,7 

1991 

97,4 

95,9 

1969 

77,3 

65,0 

1992 

100,0 

100,0 

1970 

78,8 

66,3 

1993 

99,7 

100,4 

1971 

80,2 

69,0 

1994 

99,0 

101,3 

1972 

82,6 

71,2 

1995 

98,7 

101,5 

1973 

84,3 

73,4 

1996 

99,4 

104,5 

1974 

83,3 

72,3 

1997 

100,5 

106,5 

1975 

84,1 

74,8 

1998 

105,2 

109,5 

1976 

86,4 

77,1 

1999 

108,0 

112,8 

1977 

87,6 

78,5 

2000 

112,0 

116,1 

1978 

89,1 

79,3 

2001 

113,5 

119,1 

1979 

89,3 

79,3 

2002 

115,7 

124,0 

1980 

89,1 

79,2 

2003 

117,7 

128,7 

1981 

89,3 

80,8 

2004 

119,0 

132,7 

1982 

90,4 

80,1 

2005 

120,2 

135,7 


Notas: Y = mdice de remunera^ao real por hora, setor empresarial (1992 = 100) 


X = mdice de produ^ao, setor empresarial (1992 = 100). 
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FIGURA 12.7 

130 



Indice de 




remuneragao (Y) e 

120 



fndice de 




produtividade (X), 

110 



Estados Unidos, 
1960-2005. 




100 


o 0 ° % 

6 > o° 

. 0 


90 


o 

o 

o 


80 


o 

o 

8 

o 


70 


o 

o 

o 

o 

o 


60 

50 


o 

1 1 1 


40 


60 


80 


100 


120 


140 


160 


12.6 Detec^ao de autocorrelagao 


I. Metodo grafico 

Lembre-se de que a hipotese da ausencia da autocorrelagao do modelo classico refere-se aos ter¬ 
mos de erro da populagao, u t , que nao sao observados diretamente. O que temos sao suas proxies, os 
resfduos u,, que podem ser obtidos pelo procedimento habitual dos MQO. Embora os u, nao sejam a 
mesma coisa que u,, n muitas vezes um exame visual dos u da algumas pistas sobre a provavel pre- 
senga de autocorrelagao dos u. Na verdade, um exame visual de u, ou (uf) pode fornecer informagoes 


FIGURA 12.8 

Resfduos (ampliados 
100 vezes) efetivos 
e padronizados da 
regressao dos 
salarios contra a 
produtividade 
(forma logaritmica: 
modelo, (12.5.2)). 



Ano 


17 Mesmo que os termos de erro sejam homocedasticos e nao correlacionados, seus estimadores, os resfduos, u t , 
sao heterocedasticos e autocorrelacionados. Veja MADDALA, G. S. Introduction to econometrics. 2. ed. Nova 
York: Macmillan, 1992. p. 480-481. Contudo, pode-se demonstrar que, a medida que a amostra aumenta in- 
definidamente, os resfduos tendem a convergir para seus verdadeiros valores, os u t . Veja MALINVAUD, E. 
Statistical methods of econometrics. 2. ed. Amsterda: North-Holland Publishers, 1970. p. 88. 
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iiteis nao apenas quanto a autocorrelafao, mas tambem quanto a heterocedasticidade (abordada no 
capitulo anterior), a inadequafao ou aos vieses de especificapao, como veremos no proximo capi- 
tulo. Como observa um autor: 

A importancia de elaborar e analisar graficos [dos residuos] como parte rotineira da analise estatistica 
deve ser destacada. Alem de fomecer um resumo simples para entender um problema complexo, eles 
permitem o exame simultaneo dos dados como um agregado ao mesmo tempo em que exibem o com- 
portamento dos casos individuals. 18 

Existem varias maneiras de analisar os residuos. Podemos apenas plota-los contra o tempo, uma 
plotagem sequencial no tempo, como fizemos na Figura 12.8, que mostra os residuos obtidos por 
meio da regressao dos salarios contra a produtividade (12.5.2). Os valores desses residuos sao apre- 
sentados na Tabela 12.5 com alguns outros dados. 

Como altemativa, podemos plotar os residuos padronizados contra o tempo, que tambem estao na 
Figura 12.8 e na Tabela 12.5. Os residuos padronizados sao simplesmente os residuos (u t ) divididos 
pelo erro padrao da regressao (\/7r^), ou seja, ( u,/a ). Observe que u, e a sao medidos na mesma uni- 
dade em que o regressando Y. Os valores dos residuos padronizados, portanto, serao numeros puros 
(sem unidade de medida) e podem ser comparados com os residuos padronizados de outras regres- 
soes. Alem disso, os residuos padronizados, como u„ tem media zero (por que?) e uma variancia 
aproximadamente unitaria. 19 Em grandes amostras (u,/o) apresenta uma distribuipao aproximada- 
mente normal com media zero e variancia unitaria. Em nosso exemplo, o = 2,6755. 


TABELA 12.5 Residuos: efetivos, padronizados e defasados. 


Obs. 

RES1 

RESP 

RES1(-1) 

Obs. 

RES1 

RESP 

RES1(-1) 

1960 

-0,036068 

-1,639433 

NA 

1983 

0,014416 

0,655291 

0,038719 

1961 

-0,030780 

-1,399078 

-0,036068 

1984 

0,001 774 

0,080626 

0,014416 

1962 

-0,026724 

-1,214729 

-0,030780 

1985 

0,001620 

0,073640 

0,001774 

1963 

-0,029160 

-1,325472 

-0,026724 

1986 

0,013471 

0,612317 

0,001620 

1964 

-0,026246 

-1,193017 

-0,029160 

1987 

0,013725 

0,623875 

0,013471 

1965 

-0,028348 

-1,288551 

-0,026246 

1988 

0,01 7232 

0,783269 

0,013725 

1966 

-0,017504 

-0,795647 

-0,028348 

1989 

-0,004818 

-0,219005 

0,017232 

1967 

-0,006419 

-0,291762 

-0,017504 

1990 

-0,006232 

-0,283285 

-0,004818 

1968 

0,007094 

0,322459 

-0,006419 

1991 

-0,004118 

-0,187161 

-0,006232 

1969 

0,018409 

0,836791 

0,007094 

1992 

-0,005078 

-0,230822 

-0,004118 

1970 

0,024713 

1,123311 

0,018409 

1993 

-0,010686 

-0,485739 

-0,005078 

1971 

0,016289 

0,740413 

0,024713 

1994 

-0,023553 

-1,070573 

-0,010686 

1972 

0,025305 

1,150208 

0,016289 

1995 

-0,027874 

-1,266997 

-0,023553 

1973 

0,025829 

1,174049 

0,025305 

1996 

-0,039805 

-1,809304 

-0,027874 

1974 

0,023744 

1,079278 

0,025829 

1997 

-0,041164 

-1,871079 

-0,039805 

1975 

0,011131 

0,505948 

0,023744 

1998 

-0,013576 

0,617112 

-0,041164 

1976 

0,018359 

0,834515 

0,011131 

1999 

-0,006674 

-0,303364 

-0,013576 

1977 

0,020416 

0,927990 

0,018359 

2000 

0,010887 

0,494846 

-0,006674 

1978 

0,030781 

1,399135 

0,020416 

2001 

0,007551 

0,343250 

0,010887 

1979 

0,033023 

1,501051 

0,030781 

2002 

0,000453 

0,020599 

0,007551 

1980 

0,031604 

1,436543 

0,033023 

2003 

-0,006673 

-0,303298 

0,000453 

1981 

0,020801 

0,945516 

0,031604 

2004 

-0,015650 

-0,711380 

-0,006673 

1982 

0,038719 

1,759960 

0,020801 

2005 

-0,020198 

-0,918070 

-0,015650 


Notas: RES1 = residuos da regressao salario contra produtividade (forma logarftmica). 
RES1(- 1) = residuos com defasagem de um perfodo. 

RESP = residuos padronizados = residuos / erro padrao de estimativa. 


18 WEISBERC, Stanford. Applied linear regression. Nova York: John Wiley & Sons. p. 120, 1980. 

19 Na verdade, os residuos chamados de Studentizados sao os que tem variancia unitaria. Mas na pratica, os residuos 
padronizados darao a mesma imagem e, por isso, podemos confiar neles. Sobre esse assunto, veja DRAPER, 
Norman; SMITH, Harry. Applied regression analysis. 3. ed. Nova York: John Wiley & Sons, 1998. p. 207-208. 





Capitulo 12 Autocorrelagao: o que acontece se os tennos de erro sao correlacionados? 433 

Examinando a plotagem sequential no tempo da Figura 12.8, observamos que tantos u, quanto os 
u, padronizados exibem o padrao visto na Figura 12 Ad, sugerindo que os u, talvez nao sejam aleatorios. 

De maneira diferente, podemos plotar u, contra u,_ ,, isto e, os resfduos no periodo t contra seu 
valor em (t — 1), uma especie de teste aplicado do processo AR(1). Se os residuos forem nao aleato¬ 
rios, devemos obter uma imagem semelhante as da Figura 12.3. Essa forma de representar os residuos 
esta na Figura 12.9 para o caso da regressao salarios-produtividade, e os dados que lhe dao origem 
sao os da Tabela 12.5. Como a figura mostra, a maioria dos residuos agrupa-se no segundo (nordeste) 
e no quarto (sudoeste) quadrantes, sugerindo forte correla 9 ao positiva nos resfduos. 

O metodo grafico que acabamos de ver, embora poderoso e sugestivo, e de natureza subjetiva ou 
qualitativa. Mas existem varios testes quantitativos que podem ser usados para complementar a abor- 
dagem puramente qualitativa. Veremos alguns deles a seguir. 

II. O teste das carreiras 

Se examinarmos cuidadosamente a Figura 12.8, notaremos uma caracteristica peculiar: inicial- 
mente, temos varios resfduos negativos, depois uma serie de resfduos positivos, e novamente varios 
residuos negativos. Se esses residuos fossem puramente aleatorios, poderiamos observar um padrao 
desse tipo? 

Intuitivamente, parece improvavel. E podemos testar tal fato mediante o chamado teste das car¬ 
reiras, tambem conhecido como teste de Geary, um teste nao parametrico. 20 

Para explicarmos o teste de carreiras, simplesmente anotemos os sinais (+ ou —) dos resfduos 
obtidos por meio da regressao dos salarios contra a produtividade, apresentados na primeira coluna 
da Tabela 12.5. 

(-)(+++++++++++++++++++++)(-)(+++)(-) (12.6.1) 

Dessa forma, ha 8 resfduos negativos, seguidos por 21 positivos, e depois ha mais 11 resfduos 
negativos, seguidos por 3 positivos, seguidos por 3 negativos, para um total de 46 observa 9 oes. 

Definiremos uma carreira como uma sequencia ininterrupta de um simbolo ou atributo, tais como 
+ ou —. Definiremos, em seguida, a extensao da carreira como o mimero de elementos que a formam. 
Na sequencia mostrada na Equai^ao (12.6.1), ha 5 carreiras: uma carreira de 8 menos (com tamanho 
8), uma carreira de 21 mais (com tamanho 21), outra de 11 menos (com tamanho 11), uma carreira de 
3 mais (com tamanho 3), e outra de 3 menos (com tamanho 3). Para facilitar a visualiza 9 ao, as varias 
carreiras estao entre parenteses. 

Examinando como as carreiras comportam-se em uma sequencia de observaqoes rigorosamente 
aleatorias, podemos derivar um teste de aleatoriedade das carreiras. A pergunta a ser feita e: as 5 
carreiras observadas em nosso exemplo ilustrativo de 46 observa 9 oes sao de mais ou de menos em 
rela 5 ao ao numero de carreiras esperado em uma sequencia rigorosamente aleatoria de 46 observa- 
qoes? Se houver carreiras demais, isso significaria que, no nosso exemplo, os residuos frequentemen- 
te alteram o sinal, indicando uma correla 9 ao serial negativa (veja a Figura 12.3/;). Da mesma forma, 
se houver poucas carreiras, isso sugerira um autocorrela 9 ao positiva, como na Figura 12.3a. A priori, 
a Figura 12.8 indicaria correla 9 ao positiva dos resfduos. 

Agora fa 9 amos 

N — numero total de observa 9 oes — N t + N 2 
A] = numero de sinais + (resfduos +) 

N 2 — numero de sinais — (resfduos —) 

R = numero de carreiras 


20 Nos testes nao parametricos, nao fazemos hipoteses sobre a distribuifao (de probabilidade) das quais as 
observagoes sao extrafdas. Sobre o teste de GEARY, veja GEARY, R. C. "Relative efficiency of count sign changes 
for assessing residual autoregression in least squares regression." Biometrika, 1970. v. 57, p. 123-127. 
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FIGURA 12.9 

Resfduos atuais contra 
resfduos defasados. 


04 



Resl(-l) 


Sob a hipotese nula de que os resultados sucessivos (aqui, residuos) sao independentes e supondo 
que N\ > 10 e N 2 > 10, o numero de carreiras apresentadas e (assintoticamente) normalmente distri- 
buido com: 


Media: 


E(R) 


2N\N 2 

N 


+ 1 


Varia£ao: 


2 _ 2N\N 2 (2N\N 2 - N) 
R ~ (. N) 2 (N - 1) 


( 12 . 6 . 2 ) 


Nota: N — N { + N 2 . 

Se a hipotese nula de aleatoriedade for sustentavel, de acordo com as propriedades da distribui 9 ao 
normal, deveriamos esperar que: 

Prob [£(«) - 1,96(7* < R < E(R) + l,96o*] = 0,95 (12.6.B) 

Isto e, 95% de probabilidade de que o intervalo acima inclua R. Portanto, podemos recorrer a se- 
guinte regra: 


Regra de decisdo Nao rejeite a hipotese nula de aleatoriedade com 95% de confian^a se R, o numero de 
carreiras, ficar no intervalo de confianfa citado; rejeite-a se o R estimado ficar fora desses li- 
mites. (Nota: o pesquisador devera escolher o nfvel de confian^a desejado.) 


Voltando ao nosso exemplo, sabemos que N\, o numero de sinais positivos, e de 24 e N 2 , o nume¬ 
ro de sinais negativos, e de 22 e que R — 5. Utilizando as formulas indicadas na Equa^ao (12.6.2), 
obtemos: 


E(R) = 24 

°R= 11 
a R = 3,32 


(12.6.4) 
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Logo, o intervalo de confianpa de 95% para R em nosso exemplo e: 

[24 ± 1,96(3,32)] = (17,5; 30,5) 

Obviamente, esse intervalo nao inclui o numero 5. Podemos rejeitar, com 95% de confianpa, a hipotese 
de que os resfduos da regressao dos salarios contra a produtividade sejam aleatorios. Em outras pala- 
vras, os resfduos apresentam autocorrelagao. Como regra geral, se houver autocorrela 9 ao positiva, o 
numero de carreiras sera pequeno; se a autocorrelagao for negativa, o numero de carreiras sera grande. 
Claro que, por meio da Equa^'ao (12.6.2), podemos saber se temos muitas ou poucas carreiras. 

Swed e Eisenhart elaboraram tabelas especiais que dao valores criticos para as carreiras esperadas 
em uma sequencia aleatoria de N observa 9 oes se A) ou N 2 for menor do que 20. Essas tabelas sao 
apresentadas na Tabela D.6 do Apendice D. Desse modo, o leitor podera verificar que os residuos da 
regressao dos salarios contra a produtividade sao, de fato, nao aleatorios; na verdade estao correla¬ 
cionados positivamente. 

III. O teste d de Durbin-Watson 21 

O teste mais famoso para a detecgao serial e o desenvolvido pelos estatfsticos Durbin e Watson. 
Popularmente conhecido como estatistica d de Durbin-Watson, ele e definido como: 



Y!r=i(Mt- fit-0 2 


E t=n 
t= 1 


(12.6.5) 


que e apenas a razao da soma das diferen 9 as, elevadas ao quadrado, entre resfduos sucessivos e a 
SQR. Note que, no numerador da estatistica d, o numero de observa 9 des e n — 1, porque perde-se 
uma observa 9 ao no calculo das diferen 9 as sucessivas. 

Uma grande vantagem da estatfstica d e que ela se baseia nos resfduos estimados, que costumam 
ser calculados na analise de regressao. Em razao dessa vantagem, agora se tornou pratica comum 
informar o d de Durbi-Watson com outras medidas, como o R 2 , o R 2 ajustado, t e F. Embora atual- 
mente seja empregado como rotina, e importante estar atento as hipoteses que fundamentam a 
estatistica d: 


1. O modelo de regressao inclui o termo de intercepto. Se nao estiver presente, como no caso 
da regressao que passa pela origem, e essencial refazer a regressao, incluindo o intercepto 
para obter a SQR. 22 

2. As variaveis explanatorias, os X, sao nao estocasticas, ou fixas, em amostras repetidas. 

3. Os termos de erro u, sao gerados pelo processo autorregressivo de primeira ordem: u, — 
pu,_ | + e t . Portanto, nao podem ser usado para detectar processos autorregressivos de ordem 
mais elevada. 

4. Pressupoe-se que o termo de erro u, seja distribufdo normalmente. 

5. O modelo de regressao nao inclui os valores defasados da variavel dependente como uma 
das variaveis explanatorias. O teste nao pode ser aplicado a modelos do seguinte tipo: 

Y t = P\ + PiXit + PiXi, + —f PkXkt + yYt -1 + u t ( 12 . 6 . 6 ) 

em que Y t _\ e o valor de Y com defasagem de um perfodo. Tais modelos sao conhecidos 
como modelos autorregressivos, que estudaremos no Capftulo 17. 


21 DURBIN, J.; WATSON, G. S. "Testing for serial correlation in least-squares regression." Biometrika, 1951. 
v. 38, p. 159-171. 

22 Entretanto, R. W. Farebrother calculou os valores d quando o intercepto esta ausente do modelo. Veja "The 
Durbin-Watson test for serial correlation when there is no intercept in the regression." Econometrica, 1980. 
v. 48, p. 1.553-1.563. 
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6 . Nao faltam observances nos dados. Em nossa regressao de salarios-produtividade para o 
periodo de 1960-2005, se por alguma razao estivessem faltanto observances para, por exem- 
plo, 1978 e 1982, a estatistica d nao faria concessao para essas observances faltantes . 23 

E dificil derivar a amostragem ou probabilidade exata da estatistica d dada na Equanao (12.6.5), 
porque, como mostraram Durbin e Watson, isso depende de uma maneira complicada dos valores de 
X presentes em uma amostra . 24 Essa dificuldade deveria ser compreensivel, porque d e calculado dos 
u,, que, evidentemente, dependem de determinados X. Diferentemente dos testes t, F ou y 2 , nao ha um 
tinico valor critico que leve a rejeinao ou a aceitapao nos termos de erro No entanto, Durbin e 
Watson conseguiram determinar um limite inferior, d L , e um superior, d v , tal que, se o d calculado da 
Equanao (12.6.5) estiver fora desses valores cnticos, pode-se tomar uma decisao arespeito da presen- 
5 a de correlanao serial positiva ou negativa. Alem disso, esses limites dependem apenas do numero 
de observances n e do numero de variaveis explanatorias, e nao dos valores assumidos por essas va¬ 
riaveis. Os limites, para n de 6 a 200 e ate 20 variaveis explanatorias, foram tabulados por Durbin e 
Watson e estao na Tabela D.5 do Apendice D. 

O procedimento seguido no teste pode ser explicado melhor com auxilio da Figura 12.10, que 
mostra que os limites de d sao 0 e 4. Estes podem ser estabelecidos como se segue. Expandimos a 
Equapao (12.6.5) para obter: 


d = 


E u] + X!«?-1 - 2 H u t u t - 1 


(12.6.7) 


Uma vez que e ir t _, diferem apenas em uma observapao, sao aproximadamente iguais. 
Assim, sendo ^ u 2 _ j = ^ m 2 a Equan'ao (12.6.7) pode ser escrita como 


d = 2(1 - ^ y 1 ;- 1 

E«f 


( 12 . 6 . 8 ) 


em que significa aproximadamente. 
Agora vamos definir 


1 


(12.6.9) 


FIGURA 12.10 
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23 Para mais detalhes, veja KOROSI, Gabor; MATYAS, Laszlo; SZEKEY, Istvan P. Practical econometrics. Inglaterra: 
Avebury Press, 1992. p. 88-89. 

24 Veja a discussao sobre o teste "exato" de Durbin-Watson mais a frente nesta segao. 
















Capftulo 12 Autocorrelagao: o que acontece se os tennos de erro sao correlacionados? 437 


como o coeficiente de autocorrelagao de primeira ordem amostral, um estimador de p. (Veja a nota de 
rodape 9.) Usando a Equagao (12.6.9), podemos expressar a Equagao (12.6.8) como 

d ~ 2(1 - q) ( 12 . 6 . 10 ) 

Mas, como — l<p<l, a Equagao (12.6.10) implica que 

0 < d < A ( 12 . 6 . 11 ) 

Esses sao os limites de d: qualquer valor estimado de d deve ficar entre esses limites. 

E evidente, da Equagao (12.6.10), que, se p — 0, d — 2; isto e, se nao houver correlagao serial (de 
primeira ordem), espera-se que d seja em torno de 2. Como regra pratica, se constatannos que d e 
igual a 2 em uma aplicagdo, podemos supor que ndo lid correlagao de primeira ordem, seja positiva 
ou negativa. Se p — +1, indicando correlagao positiva perfeita nos residuos, d % 0. Quanto mais 
proximo d for de 0, maior a evidencia da correlagao serial positiva. Essa relagao deveria ser evidente 
da Equagao (12.6.5), porque, se houver autocorrelagao positiva, os u, se juntarao e suas diferengas 
tenderao a ser pequenas. Como resultado, a soma dos quadrados do numerador sera menor que a do 
denominador, que permanece um valor unico para qualquer regressao dada. 

Se p — —1, isto e, ha correlagao negativa perfeita entre os residuos sucessivos, d ~ 4. Quanto 
mais proximo d estiver de 4, maior a evidencia de correlagao serial negativa. Novamente, examinan- 
do a Equagao (12.6.5), isso e compreensivel. Pois, se ha autocorrelagao negativa, um u, positivo 
tendera a ser seguido de um u, negativo e vice-versa, de modo que \u, — u,_\\ em geral sera maior que 
\u t \. Em consequencia, o numerador de d sera comparativamente maior que o denominador. 

As etapas envolvidas no teste de Durbin-Watson sao apresentadas a seguir, supondo-se que as 
hipoteses que o fundamentam sejam respeitadas: 

1. Efetua-se a regressao por meio de MQO, obtendo-se os residuos. 

2. Calcula-se d da Equagao (12.6.5). (Atualmente, a maioria dos programas de computador tem 
esse recurso.) 

3. Para um dado tamanho amostral e numero de variaveis explanatorias, determine os valores d L 
e d[j criticos. 

4. Agora siga as regras de decisao apresentadas na Tabela 12.6. Para facilitar sua consulta, essas 
regras tambem estao na Figura 12.10. 

Para ilustrarmos o mecanismo, retomemos nossa regressao de salarios-produtividade. Dos dados apre- 
sentados na Tabela 12.5, o valor d estimado pode ser mostrado como 0,2175, sugerindo que ha uma corre¬ 
lagao serial positiva nos residuos. Das tabelas de Durbin-Watson, constatamos que, para 46 observagoes e 
uma variavel explanatoria, d L — 1,475 e d { , — 1,566 ao nivel de 5%. Uma vez que o d calculado, 0,2175, 
esta abaixo de d L , nao podemos rejeitar a hipotese de que ha correlagao serial positiva nos residuos. 

Embora seja extremamente usado, o teste d tem uma grande desvantagem: se cair na zona de 
indecisao, nao se pode concluir se ha ou nao autocorrelagao de primeira ordem. Para resolver esse 
problema, varios autores propuseram modificagoes do teste d, mas sao bastante complicadas e 
estao alem do escopo deste livro. 25 Em muitas situagoes, no entanto, constatou-se que o limite 


TABELA 12.6 

Teste d de Durbin- 
Watson: Regras de 
decisao 


Hipotese nula 

Decisao 

Se 

Nao ha autocorrelagao positiva 

Rejeitar 

0 < d < dL 

Nao ha autocorrelagao positiva 

Sem decisao 

d L < d< du 

Nao ha autocorrelagao negativa 

Rejeitar 

4 - dr < d < 4 

Nao ha autocorrelagao negativa 

Sem decisao 

4 - du<d<4-d L 

Nenhuma autocorrelagao, positiva ou negativa 

Nao rejeitar 

du < d < 4 - d u 


25 Para detalhes, veja FOMBY, Thomas B.; HILL, R. Carter; JOHNSON, Stanley R. Advanced econometric methods. 
Nova York: Springer Verlag, 1984. p. 225-228. 
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superior d v e aproximadamente o verdadeiro limite de significancia e, portanto, no caso em que 
d fica na zona de indecisao, pode-se usar o seguinte teste d modifieado: dado o nivel de signi¬ 
ficancia a, 

1. H 0 : p — 0 versus Hp p > 0. Rejeitar H 0 ao nivel a se d < d v . Isto e, ha autocorrelaqao positiva 
estatisticamente significativa. 

2. H 0 : p — 0 versus //,: p< 0. Rejeitar H Q ao nivel a se o nivel estimado (4 — d)< d l; . Isto e, ha 
evidencia estatisticamente significativa de autocorrelaqao negativa. 

3. H 0 : p — 0 versus Hp. p ^ 0. Rejeitar H 0 ao nivel 2a se d < d tJ ou (4 — d) < d v . Isto e, ha evi¬ 
dencia estatisticamente significativa de autocorrelaqao, positiva ou negativa. 

Pode-se salientar que a zona de indecisao estreita-se a medida que o tamanho da amostra aumenta, 
o que pode ser visto claramente nas tabelas de Durbin-Watson. Por exemplo, com 4 regressores e 20 
observaqoes, os valores inferior e superior de d a 5% sao 0,894 e 1,828, respectivamente, mas esses 
valores sao 1,515 e 1,739 se o tamanho da amostra for 75. 

O programa SHAZAM efetua um teste exato, ou seja, ele da o p-valor, a probabilidade exata do 
valor d calculado. Com as facilidades de calculo em computador que temos atualmente, nao e mais 
dificil encontrar o valor p calculado da estatistica d. Usando o SHAZAM (versao 9) para nossa regres¬ 
sao de salarios contra produtividade, verificamos que o valor-/? do d calculado de 0,2176 e praticamen- 
te zero, reconfirmando, assim, nossa conclusao anterior baseada nas tabelas de Durbin-Watson. 

O teste d de Durbin-Watson tornou-se tao respeitado que os usuarios muitas vezes se esquecem 
das hipoteses que o fundamentam. Em especial, as hipoteses de que (1) as variaveis explanatorias, ou 
regressores, sao nao estocasticas; (2) o termo de erro segue a distribuiqao normal; (3) os modelos de 
regressao nao incluem os valores defasados do regressando; e (4) apenas a correlaqao serial de pri- 
meira ordem e levada em conta. Devemos acrescentar tambem que uma estatistica significativa d 
pode nao indicar necessariamente autocorrelaqao. Em vez disso, ela pode ser indicaqao de omissao 
de variaveis relevantes no modelo. 

Se um modelo de regressao content valores defasados do regressando, o valor d em tais casos e 
frequentemente em torno de 2, o que sugere que nao ha autocorrelaqao (de primeira ordem) em tais 
modelos. Ha um vies embutido contra descobrir autocorrelaqao (de primeira ordem) em tais modelos. 
Isso nao significa que os modelos autoregressivos nao sofram do problema de autocorrelaqao. De 
fato, Durbin desenvolveu o chamado teste h para testar correlaqao serial em tais modelos. Mas esse 
teste nao e tao poderoso, no sentido estatlstico, quanto o teste de Breusch-Godfrey, discutido rapi- 
damente, de modo que nao ha necessidade de usar o teste h. Entretanto, devido a sua importancia 
historica, ele e abordado no Exercicio 12.36. 

Alem disso, se o termo de erro u, nao for NIID, o teste d usado como rotina pode nao ser confia- 
vel. 26 Nesse sentido, o teste de carreiras tem a vantagem de nao fazer nenhum pressuposto quanto a 
distribuiqao (de probabilidade) do termo de erro. Se a amostra for grande (infinita, em termos tecni- 
cos), podemos empregar o teste d de Durbin-Watson, ja que e possivel demosntrar que: 27 



( 12 . 6 . 12 ) 


Em amostras grandes a estatistica d transformada na Equaqao (12.6.12) segue a distribuiqao pa- 
drao normal. A proposito, tendo em vista a relaqao entre dtp, o coeficiente de autocorrelaqao de 
primeira ordem estimado, mostrado na Equaqao (12.6.10), segue-se que 


Jnp ~ N{ 0, 1) 


(12.6.13) 


26 Para uma discussao avanqada, veja MITTELHAMMER, Ron C.; JUDGE, George G.; MILLER, Douglas J. Econometric 
foundations. Nova York: Cambridge University Press, 2000. p. 550. 

27 Veja DAVIDSON, James. Econometric theory. Nova York: Blackwell Publishers, 2000. p. 161. 
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isto e, em amostras grandes, a raiz quadrada do tamanho da amostra vezes o coeficiente de autocor¬ 
relagao de primeira ordem estimado tambem segue a distribuigao normal padrao. 

Para ilustrar do teste, para o exemplo de salarios contra produtividade, verificamos que d = 
0,2176 com n — 46. Portanto, da Equagao (12.6.12) verificamos que 

r-( 0,2176\ 

V^6 f 1 - j = 6,0447 

Assintoticamente, se a hipotese nula de correlagao (de primeira ordem) igual a zero for verdadei- 
ra, a probabilidade de obter um valor Z (uma variavel normal padronizada) de 6,0447 ou mais sera 
extremamente pequena. Lembre-se de que, para uma distribuigao normal padrao, o valor Z crftico 
(bicaudal) a 5% e de apenas 1,96 e a 1% e de cerca de 2,58. Embora o tamanho de nossa amostra seja 
de apenas 40 observagoes, para fins praticos pode ser suficientemente grande para permitir o uso da 
aproximagao normal. A conclusao e a mesma: os residuos da regressao dos salarios contra a produti¬ 
vidade apresentam autocorrelagao. 

O problema mais serio com o teste d e o pressuposto de que os regressores sao nao estocasticos, 
ou seja, seus valores sao fixos em amostragens repetidas. Se esse nao for o caso, o teste d nao e vali- 
do nem em amostras finitas ou pequenas nem nas grandes. 28 E, uma vez que em geral e diffcil susten- 
tar esse pressuposto em modelos economicos envolvendo dados de series temporais, um autor afirma 
que a estatfstica de Durbin-Watson pode nao ser util em econometria que envolve series temporais. 29 
Segundo ele, existem testes mais liteis de autocorrelagao, mas todos baseiam-se em amostras grandes. 
Discutiremos um desses testes a seguir, o teste de Breusch-Godfrey. 

IV. Um teste geral de autocorrelagao: o teste de Breusch-Godfrey (BG ) 30 

Para evitar algumas das armadilhas do teste d de Durbin-Watson, os estatfsticos Breusch e 
Godfrey desenvolveram um teste de autocorrelagao que e generico no sentido de que nao permite (1) 
regressores nao estocasticos, como os valores defasados do regressando; (2) esquemas autorregressi- 
vos de ordem superior, como AR(1), AR(2) etc.; e (3) medias moveis simples ou de ordem mais 
elevada de termos de erro de rufdo branco, como s, na Equagao (12.2.1). 31 

Sem entrar em detalhes matematicos, que podem ser obtidos nas referencias, o teste BG, que 
tambem e conhecido como teste LM, 32 e feito como se segue: usamos o modelo de regressao de duas 
variaveis para ilustrar o teste, embora muitos regressores possam ser acrescentados a ele. Alem disso, 
valores defasados do regressando podem ser adicionados ao modelo. Seja 

Y, = fa + p 2 X t + u, ( 12 . 6 . 14 ) 

Supomos que o termo de erro u, siga um esquema autorregressivo de ordem p, AR(p), como se 
segue: 

Ut = P\Ut-\ + PiUt-2 + ••• + PpUi-p+Et ( 12 . 6 . 15 ) 

em que s, e um termo de erro de ruido branco, como examinado anteriormente. Como se ve, e uma 
simples extensao do processo AR(1). 

A hipotese nula H 0 a ser testada e que 

H 0 : Pi = p 2 = ■■■ = P p = 0 ( 12 . 6 . 16 ) 


28 Ibid., p. 161. 

29 HAYASHI, Fumio. Econometrics. Princeton, NJ: Princeton University Press, 2000. p. 45. 

30 Veja, GODFREY, L. G. "Testing against general autoregressive and moving average error models when the regressor 
includes lagged dependent variables." Econometrica, v. 46, p. 1 .293-1.302 1978; e BREUSCH, T. S. "Testing for 
autocorrelation in dynamic linear models." Australian Economic Papers, 1978. v. 1 7, p. 334-355. 

31 Por exemplo, na regressao Y t = ft + fi 2 + u t o termo de erro pode ser representado como u t = e t + ^ £ t _, + 
X 2 s t _ 2 , que indica uma media movel de tres perfodos do termo de rufdo branco e t . 

32 O teste se baseia no princfpio do multlplicador de Lagrange, mencionado no Capftulo 8. 
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Ou seja, nao ha correlac^ao serial de qualquer ordem. O teste BG envolve as seguintes etapas: 

1. Estime a Equagao (12.6.14) pelo MQO e obtenha os reslduos, u,. 

2. Faga a regressao u, contra o X, original (se houver mais de uma variavel X no modelo original, 
inclua-as tambem) e u ,_,, u,_u,_ p em que os ultimos sao os valores defasados dos reslduos 
estimados na etapa 1. Assim, se p = 4, introduziremos os quatro valores defasados dos reslduos 
como regressores adicionais no modelo. Note que para fazer essa regressao teremos apenas (n 
— p) observagoes (por que?). Em suma, efetue a seguinte regressao: 

u t = ai + a 2 X, + p\u t -\ + piiit-2 + •••+ P P Ut- P +s t ( 12 . 6 . 17 ) 

e obtenha R 2 dessa regressao (auxiliar). 33 

3. Se o tamanho da amostra for grande (tecnicamente infinito), Breusch e Godfrey mostraram 
que 


(m - p)R 2 ~ Xp ( 12 . 6 . 18 ) 

Assintoticamente, n — p vezes o valor R 2 obtido da regressao auxiliar (12.6.17) segue a distribui- 
gao do qui-quadrado com p graus de liberdade. Se em uma aplicagao (n — p) R 2 excede o valor critico 
do qui-quadrado no nivel de significancia escolhido, rejeitamos a hipotese nula, em que pelo menos 
p na Equagao (12.6.15) e estatisco e significamente diferente de zero. 

Os seguintes pontos praticos do teste BG podem ser observados: 

1. Os regressores incluldos no modelo de regressao podem conter valores defasados do regres- 
sando Y, ou seja, Y t _ h Y,_ 2 , etc. podem parecer como variaveis explanatorias. Compare esse 
modelo com a restrigao do teste de Durbin-Watson de que pode nao haver valores defasados 
do regressando entre os regressores. 

2. Como notado, o teste BG e aplicavel mesmo que os termos de erro sigam um processo de 
media movel (MA) de ordem p, isto e, que os u, sejam gerados como se segue: 

Ut = £t + ^\£t- i + ^2 £ t-2 + ■" + hp£t-p ( 12 . 6 . 19 ) 

em que e, e um termo de erro de ruldo branco, ou seja, o termo de erro que satisfaz todas as 
hipoteses classicas. 

Nos capltulos sobre series temporais econometricas, estudaremos detalhadamente os proces- 
sos autorregressivos e de medias moveis de ordem p. 

3. Se na Equagao (12.6.15) p = 1, significando autorregressao de primeira ordem, o teste BG e 
conhecido como teste M de Durbin. 

4. Uma desvantagem do teste BG e que o valor de p, a duragao da defasagem, nao pode ser 
especificado de antemao. E inevitavel fazer experimentagoes com o valor p. As vezes, pode- 
-se usar os chamados criterios de informagao de Akaike e Schwarz para selecionar o nume- 
ro de defasagens. Discutiremos esses criterios no Capltulo 13 e nos capltulos sobre econo- 
metria de series temporais. 

5. Dados os valores das variaveis X e os valores defasados de u, o teste supoe que a variancia 
de u na Equagao (12.6.15) seja homocedastica. 


33 A razao para o regressor original X ser inclufdo no modelo e que podemos considerar que X pode nao ser estri- 
tamente nao estocastico. Mas, se for estritamente nao estocastico, podera ser omitido do modelo. Sobre isso, 
veja WOOLDRIDGE, Jeffrey M. Introductory econometrics: a modern approach. South-Western Publishing Co., 
2003. p. 386. 
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Ilustragdo do 
teste BG: 
relagao 

saldrios contra 
produtividade 


Para ilustrarmos o teste, ele sera aplicado ao nosso exemplo. Usando um processo AR(6), 
obtivemos os resultados do Exerdcio 12.25. Dos resultados de regressao, podemos ver que 
(n — p) = 40 e R * 1 2 3 4 = 0,7498. Ao multiplicarmos esses dois, obtemos um valor de qui-quadra- 
do de 29,992. Para 6 graus de liberdade (por que?), a probabilidade de obter um valor de 
qui-quadrado de 29,992 ou maior e extremamente pequena; a tabela de qui-quadrado no 
Apendice D.4 mostra que a probabilidade de obter um valor de qui-quadrado de 18,5476 ou 
maior e de apenas 0,005. Para o mesmo grau de liberdade, a probabilidade de obter um 
valor de qui-quadrado de cerca de 30 deve ser minima. Na realidade, o verdadeiro valor p e 
quase zero. 

Portanto, concluimos que, para nosso exemplo, pelo menos uma das seis autocorrelagoes 
deve ser nao zero. 

Tentando variar as duragoes da defasagem de 1 para 6, verificamos que apenas o coefi- 
ciente AR(1) e significativo, sugerindo que nao ha necessidade de considerar mais de uma 
defasagem. Em sfntese, o teste BG nesse caso e o teste M de Durbin. 


Por que tantos testes de autocorrelagao? 

A resposta a esta pergunta e: “[...] nao existe um teste que tenha sido considerado, sem duvida 
alguma, o melhor [o mais eficiente no sentido estatistico] e por isso o analista ainda se ve na posigao 
nada invejada de considerar diversos procedimentos de teste para detectar a presenga ou estrutura, ou 
ambas, de autocorrelagao”. 34 Evidentemente, um argumento semelhante pode ser apresentado sobre 
os varios testes de heterocedasticidade discutidos no capftulo anterior. 


12.7 O que fazer ao deparar-se com a autocorrelagao: 
medidas corretivas 

Se, depois de aplicarmos um ou mais testes diagnosticos de autocorrelagao discutidos na segao 
anterior, verificamos a presenga dela, o que fazer? Temos quatro opgoes: 

1. Tentar verificar se e um caso de autocorrelagao pura e nao o resultado da especificagao 
equivocada do modelo. Como discutimos na Segao 12.1, as vezes observamos padroes em 
residuos, porque o modelo e mal especificado - ou seja, excluiu algumas variaveis importan- 
tes - ou porque sua forma funcional e incorreta. 

2. Se for autocorrelagao pura, podemos usar a transformagao adequada do modelo original de 
modo que, no modelo transformado nao tenhamos o problema de autocorrelagao (pura). 
Como no caso de heterocedasticidade, teremos de usar algum tipo de metodo de mmimos 
quadrados generalizados (MQG). 

3. Em amostras grandes, podemos usar o metodo de Newey-West para obter os erros padrao 
dos estimadores de MQO que estao corrigidos para a autocorrelagao. Esse metodo na verda- 
de e uma extensao do de erros padrao consistentes para heterocedastividade de White exa- 
minado no capftulo anterior. 

4. Em algumas situagoes podemos continuar a usar o metodo dos MQO. 

Devido a importancia de cada um desses topicos, dedicaremos uma segao a cada um deles. 


34 MITTELHAMMER, Ron C. et at, op. cit., p. 547. Lembre-se de que a eficiencia de um teste estatistico e 1 
menos a probabilidade de cometer um erro Tipo II, ou seja, 1 menos a probabilidade de aceitar uma hipotese 
falsa. A eficiencia maxima de um teste el ea minima e 0. Quanto mais proxima a eficiencia de um teste estiver 
de zero, pior sera ele, e quanto mais proxima de 1, mais eficiente sera. O que esses autores estao dizendo, es- 
sencialmente, e que nao ha um teste de autocorrelagao que seja sempre o mais eficiente. 
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12.8 Especificagao equivocada do modelo versus 
autocorrelagao pura 

Retomaremos a regressao dos salarios contra produtividade da Equagao (12.5.2). Nela, vimos que 
o valor d era de 0,2176 e com base no teste d de Durbin-Watson conclulmos que havia correlagao 
positiva no termo de erro. Essa correlagao poderia ter surgido, porque o modelo nao havia sido espe- 
cificado corretamente? Uma vez que os dados que fundamentam a regressao (12.5.1) sao series tem- 
porais, e bem possivel que tanto os salarios quanto a produtividade mostrem tendencias. Se for esse 
o caso, precisamos incluir a variavel tempo ou tendencia, t, no modelo para ver a relagao entre sala¬ 
rios e produtividade lfquida das tendencias nas duas variaveis. 

Para tanto, incluimos a variavel de tendencia na Equagao (12.5.1) e obtivemos os seguintes resultados: 


Y,= 0,1209 + 

1,0283A, 

- 0,00751 


ep= (0,3070) 

(0,0776) 

(0,0015) 

( 12 . 8 . 1 ) 

t= (0,3939) 

(13,2594) 

(-4,8903) 



R 2 = 0,9900; d = 0,4497 



E facil interpretar esse modelo: com o tempo, o indice de salarios reais foi diminuindo em 0,75 uni- 
dade, ao ano. Depois de considerar isso, se o mdice de produtividade subiu em uma unidade, em me¬ 
dia, a remuneragao geral subiu em cerca de uma unidade. O que e interessante notar e que, ao 
considerar a variavel de tendencia, o valor d ainda e muito baixo, sugerindo que a Equagao (12.8.1) 
apresenta autocorrelagao pura e nao necessariamente erro de especificagao. 

Como sabemos que a Equagao (12.8.1) e a especificagao correta? Para tanto, fazemos a regressao 
de Y contra X e X 2 para testar a possibilidade de que o fndice de salario real possa estar relacionado 
nao linearmente com o indice de produtividade. Os resultados dessa regressao sao os seguintes: 

Y, = - 1,7843 + 2,1963A, - 0,1752A 2 
t= (-2,7713) (7,5040) (-5,2785) (12.8.2) 

R 2 = 0,9906 d = 0,3561 

A interpretagao dos resultados devera ser feita pelo leitor. Para nossa finalidade, veja o Durbin-Watson, 
que ainda esta baixo, sugerindo que ainda temos correlagao serial positiva nos residuos. 

Podemos concluir da analise anterior que nossa regressao salarios contra produtividade provavel- 
mente apresenta autocorrelagao pura e nao necessariamente do vies de especificagao. Conhecendo as 
consequencias da autocorrelagao, podemos desejar fazer alguma agao corretiva. Faremos isso em breve. 

Por sinal, para todas as regressoes de salarios contra produtividade que apresentamos, aplicamos 
o teste de normalidade de Jarque-Bera e verificamos que os residuos tinham distribuigao normal, 
o que nos tranquiliza, pois o teste d pressupoe a normalidade do termo de erro. 


12.9 Corre^ao da autocorrelagao (pura): o metodo dos mmirnos 
quadrados generalizados (MQG) 

Conhecendo as consequencias da autocorrelagao, principalmente a falta de eficiencia dos estima- 
dores, podemos precisar corrigir o problema. A corregao depende do conhecimento que se tem da 
natureza da interdependencia entre os termos de erro, ou seja, do conhecimento da estrutura da auto¬ 
correlagao. 

Para comegar, consideraremos o modelo de regressao de duas variaveis: 


Yt - + faX t + u, 


(12.9.1) 
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e que o termo de erro siga o processo AR(1), a saber, 

u t = pu t ~ i + s t - 1 < p < 1 (12.9.2) 

Agora, consideraremos dois casos: (1) p e conhecido e (2) p nao e conhecido, mas precisa ser esti- 
mado. 

Quando p e conhecido 

Se o coeficiente de autocorrelaqao de primeira ordem for conhecido, o problema da autocorrela- 
qao pode ser resolvido facilmente. Se a Equaqao (12.9.1) for verdadeira no tempo t, tambem sera no 
tempo (t — 1). Portanto, 


Yt~ i - Pi + PiX t - 1 + u t - 1 


(12.9.3) 


Multiplicando a Equa 9 ao (12.9.3) por p em ambos os lados, obtemos 


pYt -1 - pP i + PthXt-i + pu t -1 


(12.9.4) 


Subtraindo a Equaqao (12.9.4) da (12.9.1), temos 


(Y t - pY t - 1) = A(1 - P) + Pi(X, - pXt-0 + s t (12.9.5) 

em que s, — ( u, — pu ,_ t ). 

Podemos expressar a Equaqao (12.9.5) como 

Y* t = P\ + PlK + s t (12.9.6) 

em que p\ = ft( 1 - p), = (7, - = {X, - pX t - { ),c p\ = p 2 . 

Uma vez que o termo de erro na Equa 9 ao (12.9.6) satisfaz as hipoteses usuais de MQO, podemos 
aplicar o MQO as variaveis transformadas 7* e A* e obter estimadores com todas as propriedades oti- 
mas, a saber, MELNT. De fato, efetuar a Equa 9 ao (12.9.6) equivale a empregar os mmimos quadrados 
generalizados (MQG) examinados no capitulo anterior - lembre-se de que os MQG nada mais sao do que 
os MQO aplicados ao modelo transformado que atende as hipoteses classicas 

A regressao (12.9.5) e conhecida como equa^ao em diferengas generalizadas, ou quase equa- 
9 ?io de diferen 9 a. Ela envolve o calculo de uma regressao de 7 contra X, nao na forma original, mas na 
forma de diferemjas, obtida subtraindo uma propor 9 ao (— p) do valor de uma variavel no perfodo 
anterior ao seu valor no perfodo atual. Nesse processo de obten 9 ao de ditcrencas, perdemos uma 
observa 9 ao, porque a primeira nao tem antecedente. Para evitar a perda de uma observa 9 ao, a primei¬ 
ra observa 9 ao em 7e X e transformada como se segue: 15 7i x /1 - p 2 e X\ V G - p 2 . Essa transforma- 
9 ao e conhecida como transforma^ao de Prais-Winsten. 

Quando p nao e conhecido 

Embora conceitualmente seja de aplica 9 ao direta, o metodo da difercnca generalizada dado na 
Equa 9 ao (12.9.5) e de diffcil implementa 9 ao, porque, na pratica, p raramente e conhecido. Portanto, 
precisamos encontrar maneiras de estimar p. Ha varias possibilidades. 

O metodo da primeira diferenga 

Uma vez que p esteja entre 0 e ±1, podemos comeqar das duas posiqoes extremas. Em um dos 
extremos, p — 0, nao ha correla 9 ao serial (de primeira ordem) e no outro, p = ± 1, ha correlagao 

3S A perda de uma observajao pode nao ser muito grave em amostras grandes, mas pode fazer diferenpa subs- 
tancial nos resultados em pequenas amostras. Sem transformar a primeira observajao como indicado, a varian- 
cia de erro nao sera homocedastica. Sobre isso, veja WOOLDRIDGE, Jeffrey, op. cit, p. 388. Sobre resultados de 
Monte Carlo, veja DAVIDSON, Russel; MACKINNON, James C. Estimation and inference in econometrics. Nova 
York: Oxford University Press, 1993. Tabela 10.1, p. 349. 
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perfeita, positiva ou negativa. Na verdade, quando efetuamos a regressao, em geral pressupomos que 
nao haja autocorrelagao e entao usamos o teste de Durbin-Watson ou outro teste para mostrar se esse 
pressuposto justifica-se. Se, no entanto, p — +1, a Equagao (12.9.5) da diferenga generalizada reduz- 

-se a equagao de primeira diferenga: 

Y,- Y, i = p 2 (X t - X,-0+ («r- u t -i) 
ou 

AY, = f 2 AX, + e, (12.9.7) 

em que A e o operador de primeira diferenga apresentado na Equagao (12.1.10). 

Uma vez que o termo de erro na Equagao (12.9.7) esta livre da correlagao serial (de primeira or- 
dem) (por que?), para efetuarmos a regressao (12.9.7) so precisamos calcular as primeiras diferengas 
tanto do regressando quanto dos regressores e efetuar a regressao com essas diferengas. 

A transformagao de primeira diferenga pode ser adequada se o coeficiente de autocorrelagao for 
muito alto, por exemplo, superior a 0,8 ou o d de Durbin-Watson for muito baixo. Maddala propos 
esta regra pratica geral: use a forma de primeira diferenga sempre que d < R 2 V ' Este e o caso de 
nossa regressao de salarios contra produtividade (12.5.2), em que verificamos que d — 0,2176 er = 
0,9845. A regressao de primeira diferenga para nosso exemplo ilustrativo sera apresentada adiante. 

Um aspecto interessante do modelo de primeiras diferengas e que ele nao tem intercepto. Para 
estimarmos (12.9.7), temos de recorrer a rotina da regressao que passa pela origem (suprime o termo 
de intercepto), que atualmente faz parte da maioria dos programas de computador. Contudo, se esque- 
cermos de excluir o termo de intercepto do modelo e estimarmos o seguinte modelo que o inclui 

AY, = Pi + f 2 AX t + e, (12.9.8) 

o modelo original deve ter um termo de tendencia incluido e (f representa o coeficiente da variavel de 
tendencia. 37 Portanto, um beneflcio “acidental” de introduzir o modelo de primeiras diferengas e testar 
quanto a presenga de uma variavel de tendencia no modelo original. 

Retornando a regressao de salarios contra produtividade (12.5.2), e dado o processo AR(1) e um 
valor baixo de d em relagao a r 2 , voltamos a efetuar a Equagao (12.5.2) na forma de primeira diferen¬ 
ga sem o termo de intercepto; lembre-se de que a Equagao (12.5.2) esta na forma de nivel. Os resul- 
tados sao os seguintes: 38 

AY t = 0.6539AW, 

t = (11,4042) r 2 = 0,4264 = 1,7442 (12.9.9) 

Em comparagao com a regressao em forma de nivel (12.5.2), vemos que o coeficiente angular nao mu- 
dou muito, mas o valor de r 2 caiu consideravelmente. Em geral e esse o caso, porque tomando as primei¬ 
ras diferengas estamos essencialmente estudando o comportamento de variaveis em tomo de seus 
valores de tendencia (linear). Evidentemente, nao podemos comparar o r 2 da Equagao (12.9.9) direta- 
mente com aquele do r da Equagao (12.5.2), porque as variaveis dependentes nos dois modelos sao 
diferentes. 39 Alem disso, note que, em comparagao com a regressao original, o valor d aumentou acen- 
tuadamente, talvez indicando que haja pouca autocorrelagao na regressao de primeiras diferengas. 40 


36 MADDALA, op. cit., p. 232. 

37 E facil mostrar isso. Seja Y t = ori + p,t + /S 2 X t + u t . Portanto, Y t _, = a + /j](t — 1) + jS 2 X t _i + u t _,. Subtraindo 
o ultimo do primeiro, obteremos: AY, = ft, + feAXf + e t , que mostra que o termo de intercepto nessa equagao e, de 
fato, o coeficiente da variavel de tendencia no modelo original. Lembre-se de que estamos supondo que p = 1. 

38 No Exercfcio 12.38 pediu-se que fosse calculado esse modelo, incluindo o termo constante. 

39 A comparagao de r 2 na forma de nivel e de primeiras diferengas e um pouco complicada. Para uma discussao 
mais detalhada sobre o assunto, veja MADDALA, op. cit., Capitulo 6. 

40 Nao se sabe com certeza se o d calculado na regressao de primeiras diferengas pode ser interpretado da mesma 
maneira que o foi na forma de nfvel, original da regressao. Entretanto, aplicando o teste de carreiras, podemos 
ver que nao ha evidencia de autocorrelagao nos resfduos da regressao de primeiras diferengas. 
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Outro aspecto interessante da transforma^ao em primeiras diferenqas relaciona-se as proprieda- 
des de estacionariedade da serie temporal subjacente. Voltemos a Equaqao (12.2.1), que descreve o 
processo AR(1). Agora, se de fato p — 1, entao esta claro, das Equaqoes (12.2.3) e (12.2.4), que a 
serie u, e nao estacionaria, pois as variancias e covariancias tornam-se infinitas. E por isso que, quan- 
do discutimos esse topico, impusemos a restriqao de que \p\ < 1. Mas esta claro, da Equaqao (12.2.1), 
que, se o coeficiente de autocorrelaqao for, de fato, 1, entao a Equaqao (12.2.1) torna-se 


u t — u t -1 + £ t 


ou 


( ll t ~ «r- l) = A U t = £ t 


(12.9.10) 


Ou seja, sao os u, de primeira difcrenqa que se tornam estacionarios, pois sao iguais a s t , que e um 
termo de erro de rufdo branco. 


O ponto da discussao anterior e que, se a serie temporal original for nao estacionaria, muito 
frequentemente suas primeiras diferen 9 as tornam-se estacionarias. E, portanto, a transforma 9 ao 
em primeiras diferen 9 as serve a um proposito duplo, pois pode nos livrar da autocorrela 9 ao (de 
primeira ordem) e tambem tornar a serie temporal estacionaria. Voltaremos a esse assunto na Par¬ 
te 5, em que discutiremos a econometria da analise de series temporais com certa profundidade. 

Mencionamos que a transforma 9 ao em primeiras diferen 9 as pode ser adequada se p for alto ou d 
for baixo. Em termos estritos, a transformapao em primeiras diferen 9 as e valida apenas se p — 1. De 
fato, existe um teste, chamado teste de Berenblutt-Webb, 41 para verificar a hipotese de que p = 1. 
O teste estatfstico que eles usam e denominado estatfstica g e pode ser definido como se segue: 


g = 


£ 


2 c t 


E n - 2 

1 Mr 


(12.9.11) 


em que u, sao os reslduos de MQO da regressao original (na forma de nfvel e e t sao os resfduos de 
MQO da regressao de primeiras diferen 9 as. Lembre-se de que na forma de primeiras diferen 9 as nao 
ha intercepto. 


Para testarmos a significancia da estatistica g, supondo que a regressao em forma de nfvel conte- 
nha o termo de intercepto, podemos recorrer as tabelas de Durbin-Watson, sendo que agora a hipote¬ 
se nula sera p — 1 e nao a hipotese de Durbin-Watson de que p — 0. 

Voltando a regressao de salarios-produtividade, para a regressao original (12.5.2) obtemos 
Y' f<? = 0,0214 c Y' e} - 0,0046. Colocando esses valores na estatfstica g dada na Equaqao 
(12.9.11), obtemos 


0,0046 

0,0214 


0,2149 


(12.9.12) 


Consultando a tabela de Durbin-Watson para 45 observa 9 oes (o numero mais proximo de 45 observa- 
9 oes)e 1 variavelexplanatoria(Apcndicc D.Tabela D.5), vcrificamosque d L — 1,288 e d v — 1,376(no 
nivel de 5%). Como o g observado esta situado abaixo do limite inferior de d, nao rejeitamos a hipo¬ 
tese de que o verdadeiro p — 1. Lembre-se de que, embora usemos as mesmas tabelas de Durbin- 
-Watson, agora a hipotese nula e que p—\e nao que p — 0. Tendo em vista esse achado, os resultados 
na Equaqao (12.9.9) podem ser aceitaveis. 


O p com base na estatistica d de Durbin-Watson 

Se nao podemos usar a transforma 9 ao das primeiras diferenqas, porque p nao esta suficientemen- 
te proximo da unidade, temos um metodo facil de calcula-lo por meio da relapao entre de p, estabe- 
lecida anteriormente na Equa 9 ao (12.6.10), da qual podemos estimar p como se segue: 

1-- (12.9.13) 


41 BERENBLUTT, I. I.; WEBB, G. I. "A new test for autocorrelated errors in the linear regression model." journal of 
the Royal Statistical Society, 1973. serie B, v. 35, n.1, p. 33-50. 
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Assim, em amostras razoavelmente grandes, pode-se obter p da Equagao (12.9.13) e usa-la para trans- 
formar os dados como mostrado na equagao das diferengas generalizadas (12.9.5). Lembre-se de que 
a relagao entre p e d dada na Equagao (12.9.13) pode nao ser verdadeira em pequenas amostras, para 
as quais Theil e Nagarpropuseram uma modificagao, apresentada no Exerdcio 12.6. 

Em nossa regressao de salarios e produtividade (12.5.2), obtemos um valor d de 0,2176. Usando 
esse valor na Equagao (12.9.13), obtemos p ~ 0,8912. Usando esse valor de p estimado, podemos 
estimar a regressao (12.9.5). Basta subtrairmos 0,8912 vezes o valor anterior de Y de seu valor cor- 
rente e, do mesmo modo, subtrair 0,8912 vezes o valor anterior de X de seu valor corrente e efetuar a 
regressao de MQO contra as variaveis assim transformadas, como na Equagao (12.9.6), em que Y) = 
(Y, - 0,89127,.!) e4 = (X, - 0,8912X,_!). 


O p estimado dos residuos 

Se o processo AR(1) u, — pu t _\ + e, for valido, uma maneira simples de estimar p e fazer a re¬ 
gressao dos residuos u t , contra u,_ h pois os u, sao estimadores consistentes do verdadeiro u t , como 
visto anteriormente. Ou seja, efetuamos a seguinte regressao: 

u,= p.u t -x+v t (12.9.14) 


em que u, sao os residuos obtidos da regressao (forma de rn'vel) original e v, sao o termo de erro dessa 
regressao. Note que nao ha necessidade de introduzir o termo de intercepto dessa na Equagao (12.9.14), 
pois sabemos que a soma dos residuos de MQO e igual a zero. 

Os residuos de nossa regressao de salarios contra produtividade dados na Equagao (12.5.1) ja 
estao na Tabela 12.5. Usando esses residuos, obtivemos os seguintes resultados da regressao: 


u t = 0, 8678m,_ i 

t= (12,7359) r 2 = 0,7863 


(12.9.15) 


Como mostra essa regressao, p — 0,8678. Usando a estimativa, podemos transformar o modelo 
original como foi feito com a Equagao (12.9.6). Uma vez que o p estimado por esse procedimento e 
aproximadamente o mesmo que aquele obtido do d de Durbin-Watson, os resultados da regressao 
usando o p da Equagao (12.9.15) nao deveriam ser muito diferentes daqueles obtidos do p estimado 
do d de Durbin-Watson. Deixamos essa verificagao para o leitor. 


Metodos iterativos de calcular p 

Todos os metodos de calcular p discutidos anteriormente fornecem apenas uma unica estimativa 
de p. Mas ha os chamados metodos iterativos que calculam p iterativamente, ou seja, por aproxima- 
gao sucessiva, comegando com um valor inicial de p. Entre os metodos podemos mencionar os se¬ 
guintes: o procedimento iterativo de Cochrane-Orcutt, o procedimento em duas etapas de 
Durbin e o procedimento de varredura ou busca de Hildreth-Lu. Destes, o mais conhecido e o 
metodo iterativo de Cochran-Orcutt. Para poupar espago, os metodos iterativos sao discutidos por 
exercicios. Lembre-se de que o objetivo desses metodos e fornecer uma estimativa de p que pode ser 
usada para obter as estimativas de MQG dos parametros. Uma vantagem do metodo iterativo de 
Cochrane-Orcutt e que ele pode ser usado para calcular nao so um processo AR(1), mas tambem 
processos autorregressivos de ordem superior, como u, — \ + [h m ,_2 + v,, que sao AR(2). Tendo 

obtido os dois ps, podemos estender facilmente a equagao de diferengas generalizadas (12.9.6). Evi- 
dentemente, o computador agora pode fazer tudo isso. 

Voltando a nossa equagao de salarios contra produtividade e supondo um processo AR(1), usamos 
o metodo iterativo de Cochrane-Orcutt, que fornece as seguintes estimativas de p: 0,8876, 0,9944 e 
0,8827. O ultimo valor de 0,8827 agora pode ser usado para transformar o modelo original como na 
Equagao (12.9.6) e estima-lo por MQO. E claro que aplicar MQO no modelo transformado e simples- 
mente o MQG. Os resultados sao os seguintes: 
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0 STATA pode estimar os coeficientes do modelo com p. Por exemplo, se supomos o AR(1), o 
STATAproduz os seguintes resultados: 

Y* = 43,1042 + 0,5712a, 

ep = (4,3722) (0,0415) (12.9.16) 

t= (9,8586) (13,7638) r 2 = 0,8146 

Desses resultados, podemos ver que o estimado (p) e ~ 0,8827, o que nao e muito diferente do p na 
Equa£ao (12.9.15). 

Como observado anteriormente, na equa^ao de diferen^as generalizadas (12.9.6) perdemos uma 
observa£ao, porque a primeira delas nao tem antecedentes. Para evitarmos perder a primeira observa- 
5 ao, podemos utilizar a transformagao de Prais-Winsten. Usando essa transforma^ao e o STATA 
(versao #10), obtemos os seguintes resultados de nossa regressao de salarios e produtividade: 

Rcompb, = 32,0434 + 0,6628 Prodb, 

ep= (3,7182) (0,0386) r 2 = 0,8799 (12.9.17) 

Nessa transforma 5 ao, p foi de 0,9193, obtido depois de 13 itera£6es. Devemos ressaltar que, se nao 
transformarmos a primeira obsen’agao a moda de Prais-Winsten e excluirmos aquela obsen’agao, os 
resultados as vezes serdo substancialmente diferentes, principalmente em pequenas amostras. Note 
que o p obtido aqui nao e muito diferente daquele da Equa§ao (12.9.15). 

Comentdrios gerais 

Ha varios pontos sobre corre£ao para a autocorrela£ao, usando os diversos metodos discutidos. 

Em primeiro lugar, uma vez que os estimadores de MQO sao consistentes apesar da autocorrela- 
£ao, em grandes amostras faz pouca diferen 9 a se estimamos p do d de Durbin-Watson ou da regressao 
dos resfduos no perfodo corrente contra os resfduos no perfodo anterior ou do procedimento iterativo 
de Cochrane-Orcutt, porque todos eles fomecem estimativas consistentes do verdadeiro p. Em segundo 
lugar, os varios metodos discutidos sao basicamente de duas etapas. Na primeira obtemos uma esti- 
mativa do p desconhecido e na segunda etapa usamos essa estimativa para transformar as variaveis 
para a equa?ao de diferen^as generalizadas, o que e basicamente MQG. Uma vez que usamos p em 
vez do verdadeiro p todos esses metodos de estima 5 ao sao conhecidos na literatura especifica como 
metodos de mmimos quadrados generalizados factiveis (MQGF) ou MQG estimados (MQGE). 

Em terceiro lugar, e importante observar que sempre que, usamos um metodo MQGF ou um 
MQGE para estimar os parametros do modelo transformado, os coeficientes estimados nao te- 
rao necessariamente as propriedades otimas do modelo classico, como BLUE, principalmente 
em pequenas amostras. Sem entrar em aspectos tecnicos complexos, pode-se afirmar que, como 
principio geral, sempre que usamos um estimador em lugar de seu valor verdadeiro, os coefi¬ 
cientes estimados de MQO podem ter as propriedades otimas usuais assintoticamente, ou seja, 
em grandes amostras. Tambem, os procedimentos convencionais de teste de hipoteses sao, fa- 
lando em termos estritos, vdlidos assintoticamente. Em pequenas amostras, portanto, e preciso 
ter cuidado para interpretar os resultados estimados. 

Quarto, ao usar um MQGE, se nao incluirmos a primeira observac^ao (como originalmente foi o 
caso com o procedimento de Cochrane-Orcutt), nao so os valores numericos, mas tambem a eficien- 
cia dos estimadores pode ser afetada adversamente, sobretudo se o tamanho da amostra for pequeno 
e se os regressores nao forem nao estocasticos. 42 Em pequenas amostras e importante manter a pri¬ 
meira observagao a la Prais-Winsten. Evidentemente, se o tamanho da amostra for razoavelmente 
grande, o MQGE, com ou sem a primeira observa?ao, dara resultados similares. Por sinal, na litera- 


42 


Isto acontece principalmente se os regressores exibem uma tendencia, que e bem comum em dados economicos. 
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tura especifica os MQGE com a transformaqao de Prais-Winsten sao conhecidos, de forma sintetica, 
como MQGE completos ou MQGEC. 


12.10 O metodo de Newey-West para corrigir 
os erros padrao do MQO 

Em vez de usar os metodos de MQGF discutidos na seqao anterior, podemos usar ainda o MQO, 
mas corrigir os erros-padrao para autocorrela^ao por um procedimento desenvolvido por Newey e 
West. 43 Esse e uma extensao dos erros-padrao consistentes para heterocedasticidade que discutimos 
no capftulo anterior. Os erros padrao corrigidos sao conhecidos como erros padrao consistentes 
para heterocedasticidade e autocorrela^ao (CHA), ou simplesmente erros padrao de Newey- 
-West. Nao apresentamos os calculos matematicos envolvidos no procedimento de Newey-West, 
porque sao muito complexos. 44 Programas modernos de computador atualmente efetuam esses calcu¬ 
los. E importante destacar que, em termos estritos, o procedimento de Newey-West e valido em 
grandes amostras e pode nao ser adequado em pequenas amostras. Mas em grandes amostras agora 
temos um metodo que produz erros padrao corrigidos para autocorrela£ao de modo que nao precisa- 
mos hear preocupados com as transforma 9 oes de MQGE discutidas na seqao anterior. Se uma amostra 
e razoavelmente grande, deve-se usar o procedimento de Newey-West para corrigir os erros padrao 
dos MQO nao so em situa£oes de autocorrela£ao, mas em casos de heterocedasticidade, pois o meto¬ 
do CHA pode lidar com ambas, ao contrario do metodo White, designado especificamente para hete¬ 
rocedasticidade. 

Mais uma vez voltemos a nossa regressao de salarios e produtividade (12.5.1). Sabemos que essa 
regressao apresenta autocorrelagao. Nossa amostra de 46 observa 5 oes e razoavelmente grande, entao 
podemos usar o procedimento CHA. Com o EViews 4, obtemos os resultados da regressao: 

Y,= 32,7419 + 0,6704A, 

ep= (2,9162)* (0,0302)* (12.10.1) 

r 2 = 0,9765 d = 0,1719 


em que * denota erros padrao CHA. 

Comparando essa regressao com a Equaqao (12.5.1), verificamos que em ambas os coeficientes 
estimados e o valor r 2 sao os mesmos. Mas e importante notar que os erros padrao CHA sao muito 
maiores que os obtidos pelos MQO e, assim, as razoes t no primeiro caso sao muito menores que as 
razoes t dos MQO. Isso mostra que os MQO subestimaram de fato os verdadeiros erros padrao. 
Curiosamente, as estatfsticas d dos dois modelos (12.5.1) e (12.10.1) sao as mesmas. Mas nao se 
preocupe, pois o procedimento CHA ja levou em conta a correcao dos erros padrao dos MQO. 


12.11 MQO versus MQGF e CHA 

O pesquisador depara-se com o seguinte problema: na presen^a de autocorrelafao, os estimadores 
de MQO, embora nao tendenciosos, consistentes e assintoticamente normalmente distribufdos, nao 
sao eficientes. Portanto, o procedimento habitual de inferencia com base nos testes t, F e x 2 deixa de 
ser adequado. Por outro lado, os procedimentos de MQGF e de Newey-West geram estimadores efi¬ 
cientes, mas cujas propriedades em amostras pequenas ou finitas nao estao bem documentadas. Isso 
significa que, em amostras pequenas, eles podem ser, na verdade, piores que os MQO. Em um estudo 


43 NEWEY, W. K.; WEST, K. "A simple positive semi-definite heteroscedasticity and autocorrelation consistent 
covariance matrix." Econometrica, v. 55, p. 703-708, 1987. 

44 Se voce tiver conhecimentos de algebra matricial, o metodo e discutido em GREENE, op. cit, 4. ed., p. 462^163. 
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de Monte Carlo, Griliches e Rao 45 verificaram que, se a amostra for relativamente pequena e o coefi- 
ciente de autocorrelanao, p, for menor que 0,3, o MQO sera tao bom ou melhor que MQGF. Como 
questao pratica, pode-se usar o MQO em pequenas amostras em que o p estimado seja, por exemplo, 
menor que 0,3. Evidentemente, o que e uma amostra grande ou pequena sao questoes relativas, e deve- 
-se recorrer a um julgamento baseado na pratica. Se voce tiver apenas 15 ou 20 observances, a amostra 
pode ser pequena, mas se tiver 50 ou mais observances, ela podera ser razoavelmente grande. 


12.12 Aspectos adicionais da autocorrelagao 


Variaveis dummy e autocorrelagao 

No Capftulo 9 consideramos os modelos de regressao da dummy binaria. Em particular, lembre- 
-se do modelo de regressao de poupan§a contra renda para o perfodo de 1970-1995, nos Estados 
Unidos, apresentado na Equaqao (9.5.1), o que, por conveniencia, e reproduzido a seguir: 

Y t = o'! + a 2 D, + p x X t + H.D t X t ) + u, (12.12.1) 

em que Y = poupanna 
X = renda 

D — 1 para observances no perfodo 1982-1995 
D = 0 para observances no perfodo 1970-1981 

Os resultados da regressao baseados nesse modelo estao na Equanao (9.5.4). Naturalmente, o 
modelo foi estimado com os pressupostos usuais de MQO. 

Mas agora suponha que u, siga um processo autorregressivo de primeira ordem, AR(1). Ou seja, 
u, — pu,_i + e,. Normalmente, se p for conhecida ou puder ser estimada por um dos metodos discu- 
tidos, podemos usar o metodo das diferennas generalizadas para estimar os parametros do modelo 
que esta livre da autocorrelanao (de primeira ordem). Entretanto, a presenna da variavel binaria D 
impoe um problema especial: note que a variavel binaria apenas classifica uma observanao como 
pertencente ao primeiro ou segundo perfodo. Como fazemos para transforma-la? Podemos ver o se- 
guinte procedimento: 46 

1. Na Equanao (12.12.1), os valores de D sao zero para todas as observances no primeiro perfo¬ 
do; no perfodo 2 o valor de D para as primeiras observances e 1/(1 — p) em vez de 1, e 1 
para todas as outras observances. 

2. A variavel X, e transformada como {X, — pX,_ t ). Note que perdemos uma observanao nessa 
transformanao, a nao ser que recorramos a transformanao de Prais-Winsten para a primeira 
observanao, como notado anteriormente. 

3. O valor de D t X t e zero para todas as observances no primeiro perfodo ( Nota: D, e zero no 
primeiro perfodo); no segundo perfodo a primeira observanao assume o valor de D,X, = X, 
e as observances remanescentes no segundo perfodo passam a ser {D,X, — D t pX,_ x ) — 
( X, — pX,_p. {Nota: o valor de D, no segundo perfodo el.) 

Como aponta a discussao anterior, uma observanao fundamental e a primeira observanao no 
segundo periodo. Se ela for tratada da maneira sugerida, nao devera haver problema para estimar 
regressoes como a Equanao (12.12.1) sujeitas a autocorrelanao AR(1). No Exercicio 12.37, o leitor e 
solicitado a efetuar essa transformanao para os dados na poupanna e renda para os Estados Unidos, 
apresentados no Capftulo 9. 


45 GRILICHES, Z.; RAO, P. "Small sample properties of several two-stage regression methods in the context of 
autocorrelated errors." lournal of the American Statistical Association, 1969. v. 64, p. 253-272. 

46 Veja MADDALA, op. cit., p. 321-322. 
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Modelos ARCH e GARCH 

Assim como o termo de erro u no tempo t pode estar correlacionado com o termo de erro no tem¬ 
po (f - 1) em um processo AR(1) ou com os varios termos de erro defasados em um processo geral 
AR(/j), pode haver autocorrela£ao na variancia er no tempo t com seus valores defasados em um ou 
mais perfodos? Tal autocorrela§ao foi observada pelos pesquisadores na previsao de series temporais, 
como pre?os de afoes, taxas de inflagao e taxas de cambio. Essa autocorrelafao recebe nomes como 
heterocedasticidade condicional autorregressiva (ARCH, do ingles autoregressive conditional he- 
teroscedasticity), se a variancia do erro estiver relacionada com o termo de erro elevado ao quadrado 
no perfodo anterior, e heterocedasticidade condicional autorregressiva generalizada (GARCH, 
do ingles generalized autoregressive conditional heteroscedasticity), se a variancia do erro estiver 
relacionada com os termos de erro elevados ao quadrado em varios perfodos anteriores. 

Como esse topico pertence a grande area de econometria de series temporais, discutiremos este 
assunto de forma mais aprofundada na Parte 4. O nosso objetivo e mostrar que a autocorrela£ao nao 
esta confinada apenas a redoes entre erros de termos antigos e atuais, mas tambem a relates entre 
erros de varia 5 oes antigos e atuais. 

Coexistencia de autocorrelagao e heterocedasticidade 

O que acontece se um modelo e afetado nao so pela heterocedasticidade, mas pela autocorrelagao? 
Sera possivel resolver o problema sequencialmente, isto e, cuidar primeiro da heterocedasticidade e 
depois da autocorrelac^ao? Na verdade, um autor afirma: “A autorregressao so pode ser detectada depois 
de controlar a heterocedasticidade”. 47 Mas sera que e possfvel formular um teste onipotente que resolva 
esse e outros problemas (como o da especificaqiao do modelo) simultaneamente? Sim, esses testes exis- 
tem, mas seu exame vai muito alem de nossos limites. E melhor deixa-los para as referencias. 48 Entre - 
tanto, como observado anteriormente, podemos usar os erros padrao ECHA, pois consideram tanto a 
autocorrela§ao quanto a heterocedasticidade, contanto que a amostra seja razoavelmente grande. 


12.13 Exemplo conclusivo 


No Exemplo 10.2, apresentamos dados sobre consumo, renda, riqueza e taxas de juros para os 
Estados Unidos, tudo em termos reais. Com base nesses dados, estimamos a seguinte fun£ao de 
consumo para os Estados Unidos, para o perfodo de 1947-2000, efetuando a regressao do logarit- 
mo de consumo sobre os logaritmos de renda e riqueza. Nao expressamos a taxa de juros na forma 
logaritmica, porque os dados reais da taxa de juros foram negativos. 

Dependent Variable: In(CONSUMPTION) 

Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 



Coefficient Std. Error t-Statistic 

Prob. 

c 

-0.467711 

0.042778 

-10.93343 

0.0000 

In(INCOME) 

0.804873 

0.017498 

45.99836 

0.0000 

In(WEALTH) 

0.201270 

0.017593 

11.44060 

0.0000 

INTEREST 

-0.002689 

0.000762 

-3.529265 

0.0009 

R-squared 

0.999560 

Mean 

dependent var. 

7.826093 

Adjusted R- 

squared 0.999533 

S.D. 

dependent var. 

0.552368 

S.E. of regression 0.011934 

E-statistic 

37832.59 

Sum squared 

resid. 0.007121 

Prob. 

(F-statistic) 

0.000000 

Log likelihood 164.5880 

Durbin-Watson stat. 

1.289219 


47 Sayrs, Lois W. Pooled time series analysis. California: Sage Publications, 1989. p. 19. 

48 Veja WOOLDRIDGE, Jeffrey M. op. cit., p. 402-403; e BERA, A. K.; JARQUE, C. M. "Efficient tests for normality, 
homoscedasticity and serial independence of regression residuals: Monte Carlo evidence." Economic Letters, 
1981. v. 7, p. 313-318. 
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Como esperado, as elasticidades de renda e riqueza sao positivas e a semielasticidade da taxa de 
juros e negativa. Embora os coeficientes estimados pa regain ser estatisticamente significativos, em 
termos individuais, precisamos verificar a possivel autocorrclapao no termo de erro. Como sabemos, 
na presenpa de autocorrelagao, os erros padrao estimados podem ser subestimados. Examinando a 
estatfstica d de Durbin-Watson, parece que os termos de erro na fun£ao de consumo apresentam au- 
tocorrelat^ao (de primeiro grau) (verifique isso). 

Para tanto, estimamos a fun£ao de consumo, permitindo a autocorrela£ao para AR(1). Os resulta- 
dos sao os seguintes: 

Dependent Variable: InCONSUMPTION 

Method: Least Squares 

Sample (adjusted): 1948-2000 

Included observations: 53 after adjustments 

Convergence achieved after 11 iterations 


Coefficient Std. Error t-Statistic Prob. 


C 

InINCOME 

InWEALTH 

INTEREST 

AR (1) 

-0.399833 

0.845854 

0.159131 

0.001214 

0.612443 

0.070954 

0.029275 

0.027462 

0.000925 

0.100591 

-5.635112 

28.89313 

5.794501 

1.312986 

6.088462 

0.0000 

0.0000 

0.0000 

0.1954 

0.0000 

R-squared 


0.999688 

Mean 

dependent var. 

7.843871 

Adjusted R-squared 

0.999662 

S.D. 

dependent var. 

0.541833 

S.E. of regression 

0.009954 

F-statistic 

38503.91 

Sum squared 

resid. 

0.004756 

Prob. 

. (F-statistic) 

0.00000 

Log likelihood 

171.7381 

Durbin-Watson stat. 

1.874724 


Esses resultados mostram claramente que nossa regressao apresenta autocorrelapao. Deixamos ao 
leitor a remo^ao da autocorrela£ao usando algumas das transforma 9 oes discutidas neste capftulo. Voce 
pode usar o p estimado de 0,6124 para as transforma 9 oes. A seguir, apresentamos os resultados com base 
nos erros padrao de Newey-West (CHA ou, em ingles, HCA) que levam em conta a autocorrelagao. 

Dependent Variable: LCONSUMPTION 
Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 

Newey-West HAC Standard Errors & Convariance (lag truncation = 3) 



Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

-0.467714 

0.043937 

-10.64516 

0.0000 

LINCOME 

0.804871 

0.017117 

47.02132 

0.0000 

LWEALTH 

0.201272 

0.015447 

13.02988 

0.0000 

INTEREST 

-0.002689 

0.000880 

-3.056306 

0.0036 


R-squared 

0.999560 

Mean dependent var. 

7.826093 

Adjusted R-squared 

0.999533 

S.D. dependent var. 

0.552368 

S.E. of regression 

0.011934 

F-statistic 

37832.71 

Sum squared resid. 

0.007121 

Prob. (F-statistic) 

0.000000 



Durbin-Watson stat. 

1.289237 


A principal diferenga entre a primeira e a ultima das regressoes e que os erros padrao dos coefi¬ 
cientes estimados mudaram substancialmente. Apesar disso, os coeficientes angulares estimados ain- 
da sao altamente significativos do ponto de vista estatistico. Entretanto, nao ha garantia de que este 
sera sempre o caso. 
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Resumo e 
conclusoes 


1. Se a hipotese do modelo classico de regressao linear — de que os termos de erro u, que entram na 
fungao de regressao populacional (FRP) sao aleatorios ou nao correlacionados — for desrespeita- 
da, surge o problema de autocorrela§ao ou correla 9 ao serial. 

2. A autocorrclagao pode surgir por diversas razoes, como inercia ou lentidao das series temporais 
economicas, de vies de espccificagao resultante da exclusao de importantes variaveis excludentes 
do modelo ou da utilizacjao incorreta da forma funcional, o fenomeno da teia de aranha, do mas- 
sageamento dos dados e de sua transformagao. Como resultado, convent distinguir entre a auto- 
correla 5 ao pura e a autocorrelaijao “induzida” devido a um ou mais fatores ja discutidos. 

3. Embora na presen 9 a de autocorrelagao os estimadores de MQO permanegam nao tendenciosos, 
consistentes e com distribuigao nonnal assintotica, eles perdem a eficiencia. Como consequencia, 
os testes habituais t, F e y 2 nao podem ser aplicados legitimamente. Desse modo, pode ser 
necessario recorrer a corre 9 oes. 

4. A a 9 ao corretiva depende da natureza da interdependencia entre os termos de erro it,. Uma vez que 
os termos de erro sao inobservaveis, a pratica comum e supor que eles sejam gerados por algum 
mecanismo. 

5. O mecanismo pressuposto em geral e o esquema autorregressivo de primeira ordem de Markov, 
que supoe que o termo de erro no perfodo de tempo corrente seja linearmente relacionado ao 
termo de erro no periodo de tempo anterior, o coeficiente de autocorrelapao p, que da a extensao 
da interdependencia. Esse mecanismo e conhecido como processo AR(1). 

6. Se o processo AR(1) for valido e o coeficiente de autocorrelafao conhecido, o problema de cor- 
rela 9 ao serial pode ser combatido facilmente, transformando os dados por meio de um procedi- 
mento de diferen 9 as generalizadas. O processo AR(1) pode ser generalizado para um AR(p). 
Tambem podemos pressupor um processo de media movel (MA) ou uma mistura dos dois proces¬ 
ses (AR e MA), conhecida como ARMA. Esse topico sera discutido nos capftulos sobre econo- 
metria de series temporais. 

7. Mesmo se usarmos um processo AR(1), o coeficiente de autocorrela 9 ao nao e conhecido a priori. 
Consideramos varios metodos de estimar p, como o cl de Durbin-Watson, o d modificado de 
Theil-Nagar, o procedimento iterativo Cochrane-Orcutt (C-O), o metodo C-O em duas etapas e o 
procedimento em duas etapas de Durbin. Em amostras grandes, esses metodos em geral criam 
estimativas similares de p, embora em pequenas amostras tenham resultados diferentes. Na prati¬ 
ca, o metodo C-O iterativo tornou-se muito usado. 

8. Usando qualquer um dos metodos discutidos, podemos utilizar o metodo das diferen 9 as generaliza¬ 
das para calcular os parametros do modelo transformado por MQO, que em essencia redunda em 
MQG. Na medida em que estimamos p (= p), chamamos o metodo de estima 9 ao de MQG factivel 
ou estimavel, ou resumidamente MQGF ou MQGE. 

9. Ao usar o MQGE, e preciso ter cautela para excluir a primeira observa 9 ao; em pequenas mostras 
a inclusao ou exclusao da primeira observa 9 ao pode fazeruma diferen 9 a marcante nos resultados. 
Portanto, em pequenas amostras e aconselhavel transformar a primeira observa 9 ao de acordo com 
o procedimento de Prais-Winsten. Em grandes amostras, faz pouca diferen 9 a se a primeira obser- 
va 9 ao e inclufda ou nao. 

10. E muito importante notar que o metodo de MQGE tem as propriedades estatisticas otimas apenas 
em grandes amostras. Em pequenas amostras, os MQO podem ser melhores que os MQGE, prin- 
cipalmente se p < 0,3. 

11. Em vez de usar os MQGE, podemos usar os MQO, mas corrigir os erros padrao para autocor- 
rela 9 ao pelo procedimento de Newey-West (CHA). Em termos estritos, esse procedimento e 
valido em grandes amostras. Uma vantagem do procedimento CHA e que nao so corrige para 
autocorrela 9 ao, mas tambem para heterocedasticidade, se houver. 

12. Evidentemente, antes da corre 9 ao vem a detec 9 ao da autocorrela 9 ao. Ha metodos formais e infor- 
mais de detec 9 ao. Entre os informais, podemos simplesmente plotar os resfduos reais ou padroni- 
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zado, ou plotar os atuais resfduos contra os antigos. Entre os metodos formais, pode-se usar o teste 
de carreiras, o teste d de Durbin-Watson, o teste da normalidade assintotica, o teste de Berenblutt- 
-Webb e o Breusch-Godfrey (BG). Destes, o preferido e mais empregado e o teste d de Durbin-Watson. 
Apesar de seu passado respeitavel, ele apresenta serias limita 9 oes. E melhor usar o teste BG, pois 
e mais geral no sentido de que permite ambas as estruturas de erro AR e MA, bem como a pre- 
senpa do regressando defasado como variavel explanatoria. Lembre-se de que e um teste de 
amostra grande. 

13. Neste capftulo tambem discutimos brevemente a detec 9 ao de autocorrela 9 ao na presen 9 a de 
variaveis binarias como regressores. 


EXERCICIOS 12.1. Diga se as afirma 9 oes seguintes sao verdadeiras ou falsas. Justifique brevemente sua resposta. 

a. Quando a autocorrela 9 ao esta presente, os estimadores de MQO sao tendenciosos, bem 
como ineficientes. 

b. O teste d de Durbin-Watson pressupoe que o termo de erro, u t , e homocedastico. 

c. A transforma 9 ao de primeira diferen 9 a para elimina 9 ao da autocorrela 9 ao pressupoe que o 
coeficiente de autocorrela 9 ao p seja igual a —1. 

d. Os valores de R * 1 de dois modelos, um deles envolvendo regressao na forma de primeira 
diferen 9 a e o outro na forma de nfvel, nao podem ser comparados diretamente. 

e. Um d de Durbin-Watson significativo nao implica necessariamente a existencia de autocor- 
rela 9 ao de primeira ordem. 

f. Na presen 9 a de autocorrela 9 ao, a variancia e os erros padrao dos valores previstos sao 
ineficientes. 

g. A exclusao de uma ou mais variaveis importantes de um modelo de regressao pode propi- 
ciar um valor d significativo. 

h. No processo AR(1), um teste da hipotese de que p = I pode ser feito pela estatfstica g de 
Berenblutt-Webb ou o d de Durbin-Watson. 

i. Na regressao da primeira diferen 9 a de Y contra as primeiras diferen 9 as de X, se existir um 
termo constante e um termo de tendencia linear, significa que no modelo original ha um termo 
de tendencia linear e outro de tendencia quadratica. 

12.2. Dada uma amostra de 50 observa 9 oes e 4 variaveis explanatorias, o que se pode dizer sobre a 

autocorrela 9 ao se (a) d — 1,05? ( b ) d — 1,40? (c) d — 2,50? (d) d — 3,97? 

12.3. Ao estudar as mudan 9 as na participa 9 ao dos trabalhadores no valor adicionado (lucro partici¬ 
pative), Gujarati considerou os seguintes modelos:* 

Modelo A: Y t = t + u, 

Modelo B: Y, = a 0 + a^t + u, a 2 t 2 + u, 

em que Y — participa 9 ao dos trabalhadores e t = tempo. Com base em dados anuais relativos 

ao periodo 1949-1964, foram obtidos os seguintes resultados para a industria de minera 9 ao: 

Modelo A: Y, = 0,4529 - 0,0041f R 2 = 0,5284 d= 0,8252 
(-3,9608) 

Modelo B: Y, = 0,4786 - 0,0127f + 0,0005^ 

(- 3,2724) (2,7777) 

R 2 = 0,6629 d = 1,82 


* GUJARATI, Damodar. "Labor's share in manufacturing industries". Industrial and Labor Relations Review, out. 
1969. v. 23, n.1, p. 65-75. 
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em que os numeros entre parenteses sao as razoes t. 

a. Existe correlapao serial no modelo A? E no modelo B? 

b. O que explica a correlapao serial? 

c. Como poderiamos distinguir uma autocorrelapao “pura” do vies de especificapao? 


12.4. Deteccao da an toco rre l a cdo: o teste da razao de Von Neumann* Supondo que os residuos de 
u, sejam extra?6es aleatorias de uma distribuigao normal, von Neumann demonstrou que, para 
grandes n, a razao 

_ E(“>- ~ m,-i) 2 /(w ~ 1) 
i2 E(“i “ «) 2 /» 


Nota: u = OnosMQO 


conhecida como razao de von Neumann, apresenta uma distribuinao aproximadamente nor¬ 
mal com media 


E 


8 2 


2 n 

n — 1 



4 n 2 


n - 2 

(n + 1 ){n - l) 3 


a. Se n for suficientemente grande, como poderiamos empregar a razao de von Neumann para 
testar a existencia de autocorrelapao? 

b. Qual a relagao entre o d de Durbin-Watson e a razao de von Neumann? 

c. A estatistica d situa-se entre 0 e 4. Quais sao os limites correspondentes para a razao de Von 
Neumann? 

d. Uma vez que a relayao depende da hipotese de que os u sao extra?oes aleatorias de uma 
distribuinao normal, como essa hipotese e valida para os residuos de MQO? 

e Suponhamos que em uma aplicac^ao verifica-se que a razao seja 2,88 com 100 observances. 
Teste a hipotese de que nao ha correlanao serial nos dados. 

Nota: B. I. Hart tabulou os valores crfticos da razao de von Neumann para amostras de ate 60 
observances. 1 

12.5. Em uma sequencia de 17 residuos, 11 positivos e 6 negativos, o numero de carreiras foi de 3. 
Existe evidencia de autocorrelapao? A resposta seria diferente se houvesse 14 carreiras? 

12.6. Estimativa de Theil-Nagar para p com base na estatistica d. Theil e Nagar sugeriram que, em 
pequenas amostras, em vez de estimar p como (1- d / 2), ele deve ser estimado como 

« 2 (1 - d/2) + k 2 
^ n 2 - k 2 

em que n — numero total de observances, d — d de Durbin-Watson e k — numero dos coefi- 
cientes (incluindo o intercepto) a serem estimados. 

Mostre que, em grandes amostras, a estimativa de p e igual aquela obtida pela formula mais 
simples (1 — d! 2). 

12.7. Estimativa de p: o procedimento de varredura ou busca de Ilildreth-Lu. Como no esquema 
autorregressivo de primeira ordem 

Uf - pu t -1 + e t 


* NEUMANN, J. von. "Distribution of the ratio of the mean square sucessive difference to the variance." Annals 
of Mathematical Statistics, 1941. v. 12, p. 367-395. 
t O quadra pode ser encontrado em JOHNSTON, op. cit., 3. ed., p. 559. 

t HILDRETH, G.; LU, J. Y. "Demand relations with autocorrelated disturbances." Michigan State University, Agri¬ 
cultural Experiment Station, Tech. Bull. 276, nov. 1960. 
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espera-se que p situe-se entre — 1 e + 1, Hildreth e Lu sugeriram um procedimento sistemati- 
co de “varredura” ou busca para localiza-lo. Eles recomendam que se selecione p entre — 1 
e + 1, utilizando, por exemplo, intervalos de 0,1 unidade e transforme-se os dados por meio 
da equa§ao de diferen§as generalizadas (12.6.5). Assim, e possrvel escolher p entre —0,9, 
—0,8,. . . , 0,8, 0,9. Para cada um dos p efetuamos a equagao de difcrcncas generalizadas e 
obtemos as SQR associada: Hildreth e Lu sugerem que se escolha o p que minimize as 

SQR (ou seja, maximizando o R 2 ). Se necessario maior refinamento, eles sugerem que se em- 
preguem intervalos ainda menores, por exemplo, 0,01 unidade, como: —0.99, —0,98,..., 0,90, 
0,91 e assim por diante. 

a. Quais as vantagens do procedimento Hildreth-Lu? 

b. Como sabemos se o valor de p selecionado para a transforma 5 ao dos dados garantira, de fato, 
um mrnimo? 

12.8. Estimando de p: o procedimento iterativo de Cochrane-Orcutt ( C-0 ).* Para ilustrar este pro¬ 
cedimento, considere o seguinte modelo com duas variaveis: 


Yt - + fcXt + u, 


( 1 ) 


e o processo AR( 1) 


U t = pu t — 1 + E t , ~ 1 < p < 1 


( 2 ) 


Cochrane e Orcutt recomendaram os seguintes passos para estimar p: 

1. Calcule a Equa§ao (1) recorrendo aos MQO e obtenha os residuos, u,. Alias, note que voce 
pode ter mais de uma variavel X no modelo. 

2. Utilizando os residuos obtidos na etapa 1, calcule a seguinte regressao: 


U t = pu t - 1 + V, 
que e a contrapartida aplicada da Equa^'ao (2). i 


(3) 


3. Usando o p obtido na Equa§ao (3), calcule a cqua^'ao de diferen 5 as generalizadas (12.9.6). 

4. Na medida em que a priori nao se sabe se o p obtido por meio da Equa§ao (3) e o melhor 


estimador de p, substitua os valores de p \ e p 2 calculados no passo (3) da regressao origi¬ 
nal, Equa?ao (1), e obtenha os novos residuos, por exemplo, um u, como 




(4) 


que podem ser facilmente calculados, ja que Y t , X,, p h e p 2 sao todos conhecidos. 

5. Agora estime a seguinte regressao: 

u t = p u t _ j + w t 


(5) 


que e semelhante a Equacjao (3), e oferece, assim, a segunda estimativa de p. 

Uma vez que nao sabemos se essa segunda estimativa depea melhor, vamos para a terceira 


rodada de estimativa e assim por diante. E por isso que o procedimento C-O e chamado de 


iterativo. Mas ate que ponto devemos continuar as rodadas? A recomenda 5 ao e que se inter- 
rompam as itera 5 oes quando as estimativas sucessivas de p diferirem por menos de 0,01 ou 
0,005. No exemplo dos salarios da produtividade, foram necessarias cerca de sete itera 9 oes 
antes que parassemos. 


* COCHRANE, D.; ORCUTT, G.H. "Applications of least-squares regressions to relationships containing autocorrelated 
error terms." Journal of American Statistical Association, 1949. v. 44, p. 32-61. 
t Note que p = J2 &tUt- Embora tendencioso, p e um estimador consistente do verdadeiro p. 
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a. Utilize o procedimento iterativo de Cochrane-Orcutt para estimar p para a regressao de 
salario e produtividade, Equapao (12.5.2). Quantas iterapoes foram necessarias antes 
de obter a estimativa “final” de pi 

b. Utilizando a estimativa final de p obtida em (a), calcule a regressao de salarios e produtivi¬ 
dade, excluindo a primeira observapao, bem como mantendo a primeira observapao. Que 
diferenpa podemos ver nos resultados? 

c. Voce acha importante manter a primeira observapao para transformar os dados e resolver 
o problema de autocorrelapao? 

12.9. Estimapao de p: o procedimento de Cochrane-Orcutt em duas etapas. Esta e uma versao 
abreviada do procedimento iterativo. Na etapa 1, estimamos p por meio da primeira iterapao, 
ou seja, da Equapao (3) do exercicio anterior, e na etapa 2 usamos essa estimativa de p para 
rodar a equapao em diferenpas generalizadas, como na Equapao (4) do exercicio anterior. As 
vezes, na pratica, esse procedimento em duas etapas gera resultados bastante semelhantes 
aos obtidos pelo processo iterativo C-O mais elaborado. 

Aplique este metodo em duas etapas a regressao dos salarios contra a produtividade (12.5.1) 
dada neste capftulo e compare seus resultados com os obtidos por meio do metodo iterativo. 
Preste atenpao em especial a primeira observapao quando da transformapao. 

12.10. Estimapao de p: o metodo em duas etapas de Durbin. * Para explicarmos este metodo, pode¬ 
mos escrever a equapao em diferenpas generalizadas (12.9.5) do seguinte modo: 

Y, = /Si(l - p) + hX t - p 2 pX t . \ + pY t . x + E t (1) 

Durbin sugere o seguinte procedimento em duas etapas para estimar p. Em primeiro lugar, 
trate a Equapao (1), como um modelo de regressao multipla, fazendo a regressao Y, em X t , 
X t _ u e Y t _i e trate o valor estimado do coeficiente de regressao Y t _ x (= p) como uma estima¬ 
tiva de p. Em segundo lugar, tendo obtido p, use-o para estimar os parametros da equapao 
em diferenpas generalizadas (12.9.5) ou sua equivalente, a Equapao (12.9.6). 

a. Aplique o metodo de Durbin em duas etapas a regressao dos salarios contra a produtivi¬ 
dade examinada no texto e compare os resultados obtidos com os dados do procedimento 
iterativo de Cochrane-Orcutt e os do metodo em duas etapas de C-O. Comente a “quali- 
dade” de seus resultados. 

b. Se examinarmos a Equapao (1), observaremos que o coeficiente de X t _ , (= — p(i 2 ) e 
igual a menos 1 vezes o produto do coeficiente de X, (= /C) e o coeficiente Y,_ x (= p). 
Como poderiamos testar se os coeficientes obedecem a restriqao? 

12.11. Ao medir os retornos de escala da oferta de eletricidade, Nerlove empregou dados relativos 
a um corte transversal de 145 fornecedoras privadas dos Estados Unidos em 1955 e calculou 
a regressao do logaritmo dos custos totais contra os logaritmos dos salarios, do pre 50 do ca¬ 
pital e do prepo do combustlvel. Ele verificou que os residuos estimados por essa regressao 
apresentavam correlapao “serial”, de acordo com o d de Durbin-Watson. Para encontrar uma 
correpao, apresentou graficamente os residuos estimados do logaritmo da produpao e obteve 
a Figura 12.11. 

a. O que mostra a figura? 

b. Como podemos ficar livres da correlapao “serial” nessa situapao? 

12.12. Os residuos de uma regressao plotados contra o tempo aparecem no diagrama de dispersao 
da Figura 12.12. O residuo “extremo” assinalado por um circulo e chamado de discrepante 
(outliers). Um dado discrepante e uma observapao cujo valor excede de maneira considera- 
vel, talvez em tres ou quatro desvios padrao, o valor medio de todas as observapoes. 


DURBIN, J. "Estimation of parameters in time-series regression models." Journal of a Royal Statistical Society, 1960. 
serie B, v. 22, p. 139-153. 
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FIGURA 12.11 

Resfduos da regressao 
estudada por Nerlove. 
(Adaptajao de 
Nerlove, Marc. 
“Return to scale in 
electric supply.” In: 
Christ, Carl F. et al. 
Measurement in 
Economics. Stanford, 
Calif.: Stanford 
University Press, 
1963.) 



FIGURA 12.12 

Resfduos de uma 
regressao hipotetica 
plotados contra o 
tempo. 
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a. Quais as razoes da existencia do(s) dados(s) discrepante(s)? 

b. Se houver dados discrepantes, essas observa 9 oes deveriam ser descartadas e a regressao 
calculada com as observa 9 oes restantes? 

c. O cl de Durbin-Watson aplica-se quando ha dados discrepantes? 

12.13. Com base na estatfstica d de Durbin-Watson, como podemos distinguir a autocorrelaijao 
“pura” do vies de cspecificagao? 

12.14. Suponha que no modelo 

Yt = fS i + fa X t + Ui 

os u sejam, de fato, serialmente independentes. O que aconteceria nessa situa 5 ao se, supondo que 
u, — pit, | + s |, empregassemos a regressao de difercncas generalizadas? 

Yt ~ pY t -\ = ^i(l - p) + p 2 X t - pf} 2 X t i + s t 

Discuta, em particular, as propriedades do termo de erro s t . 

12.15. Em um estudo para determina 9 ao dos pre 90 S do produto final a custos de produ 9 ao no Reino 
Unido, foram obtidos os seguintes resultados de uma regressao com base em dados anuais 
relativos ao periodo 1951-1969: 

PF, = 2,033 + 0,273IP,- 0,52LY,+ 0,256 M,+ 0,028M,_i+ 0,121PF,_! 
ep= (0,992) (0,127) (0,099) (0,024) (0,039) (0,119) 

R 2 = 0.984 d — 2.54 
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em que PF = precis do produto final a custos de produfao; W — salarios e ordenados por 
pessoa empregada; X — produto interno bruto por pessoa empregada; M — prccos das impor- 
tac:oes; M ,_, = pre 90 s das importa 9 oes com defasagem de um ano; e PF,_, = pre 90 s do 
produto final a custo de produto no ano anterior.* ** 

“Com 18 observa 9 oes e 5 variaveis explanatorias, os valores de d inferior e superior foram 
de 0, 71 e de 2,06, no nivel de 5%, o valor d estimado de 2,54 indica que nao se registra au- 
tocorrela^ao positiva”. Comente. 

12.16. Cite as circunstancias sob as quais o emprego de cada um dos seguintes metodos de estima- 
?ao do coeficiente de autocorrelacjao de primeira ordcm, p, pode ser adequado: 

a. Regressao de primeira diferen 9 a. 

b. Regressao das medias moveis. 

c. Transforma 9 ao de Theil-Nagar. 

d. Procedimento iterativo de Cochrane e Orcutt. 

e. Procedimento de varredura de Hildreth-Lu. 

f. Procedimento em duas etapas de Durbin. 

12.17. Considere o modelo: 

Yt = ft i + P 2 X t + u t 

em que 

U t — P\U t - \ + p 2 U,- 2 + St 

isto e, o termo de erro segue um processo AR(2) e s, e um termo de erro de ruldo branco. 
Esboce os passos a serem seguidos para estimar este modelo levando em conta a autorregres- 
sao de segunda ordem. 

12.18. Incluindo o fator de corre 9 ao C, a formula para 1 apresentada na Equa 9 ao (12.3.1), e 

oMQG _ (1 ~ P 2 )X l.V] + T!Ll( x t ~ PX t -l)(y t ~ PVt-l) 

2 (1 - P 2 )x\ + E"=2( X « _ P x t- l) 2 

Dada essa formula e a Equa 9 ao (12.3.1), encontre a expressao para o fator de corre 9 ao C. 

12.19. Demonstre que calcular a Equa 9 ao (12.9.5) equivale a estimar o MQG discutido na Se 9 ao 
12.3, excluindo a primeira observa 9 ao de Y e de X. 

12.20. Os residuos estimados da regressao (12.9.9) apresentam os seguintes sinais, que, por facili- 
dade, sao separados por parenteses. 

(++++)(-)(+++++++)(-)(++++)( — )(+)( — )(+)( — )(++)(-) 

(+X-)(+) 

Com base no teste das carreiras, voce rejeitaria a hipotese nula de que nao ha autocorrela 9 ao 
nos residuos? 

** 12.21. Teste de correlagao serial de ordem mais elevada. 

Suponha que tenhamos series temporais de dados em uma base trimestral. Nos modelos de 
regressao que envolvem dados trimestrais, pode ser mais adequado supor um processo AR(4) 
como o seguinte, em lugar do AR(1) dado na Equa 9 ao (12.2.1): 

Uf — P4Uf-4 + £f 

isto e, suponha que o termo de erro atual correlacione-se com o do mesmo trimestre do ano 
anterior em vez de se correlacionar-se com o do trimestre imediatamente anterior. 


* Fonte: Prices and Earnings in 1951-1969: an econometric assessment, Department of Employment, Her Majesty's 
Stationery Office, 1971, Tabela C, p. 37, Equagao 63. 

** Opcional. 
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Para testar a hipotese de que p 4 = 0, Wallis* sugere a seguinte modificagao do teste d de 
Durbin-Watson: 

J _ T!t=5^Mt - U,~a) 2 
" 4 --TRE-T2- 

O procedimento de teste segue a mesma rotina examinada no texto para o teste d. Wallis 
elaborou as tabelas de c/ 4 que podem ser encontradas em seu artigo original. 

Imagine, agora, que tenhamos dados mensais. O teste de Durbin-Watson poderia ser generali- 
zado para levar em conta esses dados? Em caso positivo, mostre a formula adequada para d n - 

12.22. Suponha que voce precise estimar a seguinte regressao: 

Aln7, = j3\ + ft Ain L t + ftAln K, + u t 

em que Y e produto, L e mao de obra, K e capital e A e o operador de primeira diferenga. 
Como interpretarfamos ft nesse modelo? Poderiamos considera-lo uma estimativa de mu- 
danga tecnologica? Justifique sua resposta. 

12.23. Como observado no texto, Maddala sugeriu que se o d de Durbin-Watson for menor do que 
R 2 , podemos calcular a regressao na forma de primeira diferenga. Qual a logica que embasa 
essa sugestao? 

12.24. Consulte a Equagao (12.4.1). Suponha que r — 0 mas p ± 0. Qual o efeito sobre a E(d 2 ) se 
(a) 0 < p < 1 e (b) — 1 < p < 0? Quando o vies de a 1 sera razoavelmente pequeno? 

12.25. Os reslduos da regressao dos salarios contra a produtividade apresentados na Equagao 
(12.5.2) foram gerados usando uma regressao contra reslduos defasados em seis perlodos 
( AR[61), obtendo-se os seguintes resultados: 

Dependent Variable: SI 

Method: Least Squares 

Sample (adjusted): 1966-2005 

Included observations: 40 after adjustments 



Coefficient 

Std. Error 

t-Statistic 

Prob. 

SI(-1) 

1.019716 

0.170999 

5.963275 

0.0000 

SI(-2) 

-0.029679 

0.244152 

-0.121560 

0.9040 

SI (-3) 

-0.286782 

0.241975 

-1.185171 

0.2442 

SI(-4) 

0.149212 

0.242076 

0.616386 

0.5417 

Sl(-5) 

-0.071371 

0.243386 

-0.293240 

0.7711 

Sl(-6) 

0.034362 

0.167077 

0.205663 

0.8383 

R-squared 


0.749857 Mean 

dependent var. 

0.004433 

Adjusted R- 

squared 

0.713071 S.D. 

dependent var. 

0.019843 

S.E. of regression 

0.010629 Durbin-Waston stat. 

1.956818 

Sum squared 

resid. 

0.003841 




a. Com base no resultado anterior, o que se pode dizer sobre a natureza da autocorrelagao 
nos dados de salarios e produtividade? 

b. Se considerarmos que um processo AR(1) caracteriza a autocorrelagao nos dados, deve- 
riamos usar uma transformagao de primeiras diferengas para elimina-las? Justifique sua 
resposta. 


WALLIS, Kenneth. "Testing for fourth order autocorrelation in quarterly regression equations." Econometrica, 
1972. v. 40, p. 617-636. As tabelas de d 4 tambem podem ser encontradas em JOHNSTON, J. op. cit., 3. ed., p. 
558. 
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Exercfcios aplicados 

12.26. Passemos aos dados sobre a industria do cobre da Tabela 12.7. 

a. Estime com esses dados o seguinte modelo de regressao: 

In C[ — + @2 In If + In Lt + /I 4 In H t \ + /I 5 In At + Uf 

Interprete os resultados. 

b. Obtenha os reslduos e os residuos padronizados da regressao e faga um grafico. O que 
poderiamos dizer sobre a presen£a de autocorrelagao nesses residuos? 

c. Calcule a estatlstica d de Durbin-Watson e comente a natureza da autocorrela 5 ao presen¬ 
te nos dados. 

d. Fafa o teste das carreiras e verifique se sua resposta difere daquela dada em c. 

e. Como poderiamos verificar se um processo AR(/;) descreve melhor a autocorrelafao do que 
o processo AR(1)? 

Nota: guarde os dados para uso posterior. (Veja o Exercicio 12.28). 


TABELA 12.7 

Ano 

C 

PNB 

/ 

L 

P 

A 

Determinantes do 

1951 

21,89 

330,2 

45,1 

220,4 

1.491,0 

19,00 

pre§o interno do 

52 

22,29 

347,2 

50,9 

259,5 

1.504,0 

19,41 

cobre nos Estados 

53 

19,63 

366,1 

53,3 

256,3 

1.438,0 

20,93 

Unidos, 1951-1980 

54 

22,85 

366,3 

53,6 

249,3 

1.551,0 

21,78 


55 

33,77 

399,3 

54,6 

352,3 

1.646,0 

23,68 

56 

39,18 

420,7 

61,1 

329,1 

1.349,0 

26,01 

57 

30,58 

442,0 

61,9 

219,6 

1.224,0 

27,52 

58 

26,30 

447,0 

57,9 

234,8 

1.382,0 

26,89 

59 

30,70 

483,0 

64,8 

237,4 

1.553,7 

26,85 

60 

32,10 

506,0 

66,2 

245,8 

1.296,1 

27,23 

61 

30,00 

523,3 

66,7 

229,2 

1.365,0 

25,46 

62 

30,80 

563,8 

72,2 

233,9 

1.492,5 

23,88 

63 

30,80 

594,7 

76,5 

234,2 

1.634,9 

22,62 

64 

32,60 

635,7 

81,7 

347,0 

1.561,0 

23,72 

65 

35,40 

688,1 

89,8 

468,1 

1.509,7 

24,50 

66 

36,60 

753,0 

97,8 

555,0 

1.195,8 

24,50 

67 

38,60 

796,3 

100,0 

418,0 

1.321,9 

24,98 

68 

42,20 

868,5 

106,3 

525,2 

1.545,4 

25,58 

69 

47,90 

935,5 

111,1 

620,7 

1.499,5 

27,18 

70 

58,20 

982,4 

107,8 

588,6 

1.469,0 

28,72 

71 

52,00 

1.063,4 

109,6 

444,4 

2.084,5 

29,00 

72 

51,20 

1.171,1 

119,7 

427,8 

2.378,5 

26,67 

73 

59,50 

1.306,6 

129,8 

727,1 

2.057,5 

25,33 

74 

77,30 

1.412,9 

129,3 

877,6 

1.352,5 

34,06 

75 

64,20 

1.528,8 

117,8 

556,6 

1.171,4 

39,79 

76 

69,60 

1.700,1 

129,8 

780,6 

1.547,6 

44,49 

77 

66,80 

1.887,2 

137,1 

750,7 

1.989,8 

51,23 

78 

66,50 

2.127,6 

145,2 

709,8 

2.023,3 

54,42 

79 

98,30 

2.628,8 

152,5 

935,7 

1.749,2 

61,01 

80 

101,40 

2.633,1 

147,1 

940,9 

1.298,5 

70,87 


Nota: os dados foram coletados por Gary R. Smith com base em fontes, como American Metal Market , Metals Week e publicagoes 
do Departamento do Comercio dos Estados Unidos. 

C = media de 12 meses dos pregos internos de cobre (centavos de dolar por libra-peso). 

PNB = PNB anual (em bilhoes de $). 

I = media de 12 meses do fndice de produgao industrial. 

L = media de 12 meses dos pregos do cobre na London Metal Exchange (em libras esterlinas). 

P = numero de predios construfdos por ano (milhoes de unidades). 

A = media de 12 meses do prego do alumfnio (em centavos de dolar por libra-peso). 
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12.27. Tendo os dados na Tabela 12.8: 

a. Verifique se o d dc Durbin-Watson e igual a 0,4148. 

b. Ha correlagao serial positiva nos termos de erro? 

c. Em caso afirmativo, estime p por meio de: 

i. Metodo de Theil-Nagar. 

ii. Procedimento de Durbin em duas fases. 

iii. Metodo de Cochrane-Orcutt. 

d. Use o metodo de Theil-Nagar para transformar os dados e fa£a a regressao com os dados 
transformados. 

e. A regressao estimada em (d) apresenta autocorrelac^ao? Em caso afirmativo, como voce 
se livra dela? 


TABELA 12.8 


Y, 


despesas de consumo 
pessoal, em bilhoes de 


dolares de 1958 

X, tempo 

Y, Y estimados 

u, residuos 

281,4 

1 (= 1956) 

261,4208 

19,9791 

288,1 

2 

276,6026 

11,4973 

290,0 

3 

291,7844 

-1,7844 

307,3 

4 

306,9661 

0,3338 

316,1 

5 

322,1479 

-6,0479 

322,5 

6 

337,3297 

-14,8297 

338,4 

7 

352,5115 

-14,1115 

353,3 

8 

367,6933 

-14,3933 

373,7 

9 

382,8751 

-9,1751 

397,7 

10 

398,0569 

-0,3569 

418,1 

11 

413,2386 

4,8613 

430,1 

12 

428,4206 

1,6795 

452,7 

13 

443,6022 

9,0977 

469,1 

14 

458,7840 

10,3159 

476,9 

15 (= 1970) 

473,9658 

2,9341 


Nota: dados de Y obtidos por meio da regressao Y, = f )o + f)\X t + u t . 

12.28. Consulte o Exercicio 12.26 e os dados apresentados na Tabela 12.7. Se os resultados deste 
exercicio revelarem autocorrelac^ao serial: 

a. Recorra ao procedimento em dois estagios de Cochrane-Orcutt e obtenha as estimativas dos 
MQG factiveis viaveis ou a regressao de diferen?as generalizadas e compare seus resultados. 

b. Se o p estimado por meio do metodo de Cochrane-Orcutt em (a) diferir substancialmente 
daqueles estimados por meio da estatlstica d, qual metodo de estimativa p voce escolhe- 
ria e por que? 

12.29. Consulte o Exemplo 7.4. Omita as variaveis X 2 e X 3 , fa£a a regressao e examine os residuos 
em busca de correlac^ao “serial”. Se for encontrada a correlac^ao serial, como voce a explicaria? 
Quais medidas corretivas voce sugere? 

12.30. Consulte o Exercicio 7.21. Nesses dados, a autocorrela 9 ao e esperada a priori. Portanto, su- 
gere-se que seja feita a regressao do logaritmo da oferta real de moeda contra os logaritmos 
da renda nacional em termos reais e da taxa de juros de longo prazo na forma de primeiras 
diferen 5 as. Calcule esta regressao e depois recalcule-a em sua forma original. A hipotese que 
embasa a transforma 5 ao em primeiras difcrcncas foi atendida? Em caso negativo, que tipo de 
vies podera resusltar dessa transformayao? Ilustre com os dados que tem em maos. 

12.31. O uso do d de Durbin-Watson para verificar a ausencia de linearidade. Continue com o 
Exercicio 12.29. Organize os residuos obtidos na regressao segundo os valores crescentes de X. 
Usando a formula dada na Equayao (12.6.5), estime d por meio dos residuos rearranjados. Se 
o valor d calculado indicar autocorrelagao, implica que o modelo linear nao e adequado e que 
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o modelo deveria incluir os termos X] e X). Voce poderia apresentar uma justificativa intui- 
tiva para esse procedimento? Veja se a sua resposta esta de acordo com a de Henri Theil.* 

12.32. Consulte o Exerclcio 11.22. Obtenha os reslduos e verifique se apresentam autocorrelagao. 
Caso a correlagao serial seja detectada, como poderia ser corrigida? Qual o sentido da corre¬ 
lagao serial nesse caso? 

12.33. Experimento de Monte Carlo. Consulte as Tabelas 12.1 e 12.2. Com os dados relativos a e, e 
X, encontrados, gere uma amostra com 10 valores de Y com base no modelo 

Y, = 3,0+ 0,5X ( + u, 

em que u, — 0,9 u,_ x + e,. Suponha u 0 = 10. 

a. Calcule a regressao e comente os resultados. 

b. Suponha, agora, que u Q — 17. Repita este exercicio 10 vezes e comente os resultados. 

c. Mantenha as condigoes anteriores intactas, mas seja agora, p — 0,3 em em vez de pi — 0,9. 
Compare os resultados com os obtidos em (b). 

12.34. Utilizando os dados da Tabela 12.9, estime o modelo 

Yt = P\ + Pi X t + u t 

em que Y — estoques e X — vendas, ambos medidos em bilhoes de dolares. 

a. Calcule a regressao anterior. 

b. Verifique se os residuos estimados apresentam autocorrelagao positiva aplicando (i) o 
teste de Durbin-Watson e (ii) o teste de normalidade para grandes amostras da Equagao 
(12.6.13). 

c. Se p for positivo, aplique o teste Berenblutt-Webb para testar a hipotese de que p — 1. 


TABELA 12.9 Estoque e vendas na industria de transformagao dos Estados Unidos, 1950-1991 (milhoes de dolares) 


Ano 

Vendas* 

Estoque* 

Razao 

Ano 

Vendas* 

Estoque* 

Razao 

1950 

46.486 

84.646 

1,82 

1971 

224.619 

369.374 

1,57 

1951 

50.229 

90.560 

1,80 

1972 

236.698 

391.212 

1,63 

1952 

53.501 

98.145 

1,83 

1973 

242.686 

405.073 

1,65 

1953 

52.805 

101.599 

1,92 

1974 

239.847 

390.950 

1,65 

1954 

55.906 

102.567 

1,83 

1975 

250.394 

382.510 

1,54 

1955 

63.027 

108.121 

1,72 

1976 

242.002 

378.762 

1,57 

1956 

72.931 

124.499 

1,71 

1977 

251.708 

379.706 

1,50 

1957 

84.790 

157.625 

1,86 

1978 

269.843 

399.970 

1,44 

1958 

86.589 

159.708 

1,84 

1979 

289.973 

424.843 

1,44 

1959 

98.797 

174.636 

1,77 

1980 

299.766 

430.518 

1,43 

1960 

113.201 

188.378 

1,66 

1981 

319.558 

443.622 

1,37 

1961 

126.905 

211.691 

1,67 

1982 

324.984 

449.083 

1,38 

1962 

143.936 

242.157 

1,68 

1983 

335.991 

463.563 

1,35 

1963 

154.391 

265.215 

1,72 

1984 

350.715 

481.633 

1,35 

1964 

168.129 

283.413 

1,69 

1985 

330.875 

428.108 

1,38 

1965 

163.351 

311.852 

1,95 

1986 

326.227 

423.082 

1,29 

1966 

172.547 

312.379 

1,78 

1987 

334.616 

408.226 

1,24 

1967 

190.682 

339.516 

1,73 

1988 

359.081 

439.821 

1,18 

1968 

194.538 

334.749 

1,73 

1989 

394.615 

479.106 

1,17 

1969 

194.657 

322.654 

1,68 

1990 

411.663 

509.902 

1,21 

1970 

206.326 

338.109 

1,59 






* Os dados anuais sao medias de dados mensais sem ajustamento sazonal. 

t Os dados de fim de periodo com ajustamento sazonal a partir de 1982 nao sao comparaveis com os do periodo anterior. 
Fonte: Economic Report of the President, 1993, Tabela B - 53, p. 408. 


THEIL, Henri. Introduction to econometrics. Englewood Cliffs, NJ.: Prentice Hall, 1978. p. 307-308. 
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d. Se desconfiar que a estrutura autorregressiva do erro e de ordem p, utilize o teste de 
Breusch-Godfrey para verificar isso. Como voce escolheria a ordem de pi 

e. Com base nos resultados desse teste, como transformaria os dados para eliminar autocor- 
rclacpao? Mostre todos os calculos. 

/. Repita as etapas anteriores usando o seguinte modelo: 

In Y t = Pi + Pi In X, + u t 

g. Como decidir entre as especificapoes linear e log-linear? Mostre explicitamente o(s) 
teste(s) aplicado(s). 

12.35. ATabela 12.10 apresenta dados relativos a taxa de retorno real sobre apoes (TRRt), e a infla- 

£ao no periodo t (Inf,), bem como a taxa de crescimento da producpao no periodo (t + 1), 

(CP, + 1 ), todos em %, para a economia dos Estados Unidos no periodo de 1954-1981. 

a. Estime a regressao de TRR, contra a inflatpao. 

b. Estime a regressao de TRR, contra CP, + \ e Inf, 

c. Comente os resultados das duas regressoes, tendo em vista a observacpao de Eugene Fama 
segundo quem “a correla£ao negativa simples entre os retomos reais sobre as a£oes e a 
inflapao e esptiria, porque resulta de duas relapoes estruturais: uma relapao positiva entre 
os retornos reais atuais sobre a a 9 oes e o crescimento esperado da produ 9 ao [medido por 
CP, + 1 1, e uma relapao negativa entre o crescimento esperado e a infla 9 ao atual”. 

d. Seria de esperar autocorrela 9 ao em qualquer uma das regressoes estimadas em (a) e (/?)? 
Por que? Se for constatada a autocorrelapao, tome as medidas adequadas para elimina-la 
e apresente os resultados revistos. 


TABELA 12.10 

Estados Unidos - 
Taxa de retorno, 
crescimento da 
produipao e inflapao, 

1954-1981 

Observagao 

1954 

1955 

1956 

1957 

TRR 

53,0 

31,2 

3,7 

-13,8 

Crescimento 

6.7 

2,1 

1.8 
-0,4 

Inflagao 

-0,4 

0,4 

2,9 

3,0 

1958 

41,7 

6,0 

1,7 


1959 

10,5 

2,1 

1,5 


1960 

-T3 

2,6 

1,8 


1961 

26,1 

5,8 

0,8 


1962 

-10,5 

4,0 

1,8 


1963 

21,2 

5,3 

1,6 


1964 

15,5 

6,0 

1,0 


1965 

10,2 

6,0 

2,3 


1966 

-13,3 

2,7 

3,2 


1967 

21,3 

4,6 

2,7 


1968 

6,8 

2,8 

4,3 


1969 

-13,5 

-0,2 

5,0 


1970 

-0,4 

3,4 

4,4 


1971 

10,5 

5,7 

3,8 


1972 

15,4 

5,8 

3,6 


1973 

-22,6 

-0,6 

7,9 


1974 

-37,3 

-1,2 

10,8 


1975 

31,2 

5,4 

6,0 


1976 

19,1 

5,5 

4,7 


1977 

-13,1 

5,0 

5,9 


1978 

-1,3 

2,8 

7,9 


1979 

8,6 

-0,3 

9,8 


1980 

-22,2 

2,6 

10,2 


1981 

-12.2 

-1.9 

7.3 
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12.36. A estati'stica h de Durbin. Considere o seguinte modelo de determinagao salarial: 

Y t = P i + P 2 X t + PsY t -1 + u t 

em que Y = salarios = fndice de remuneragao real por hora 
X — produtividade = fndice de produgao por hora. 

a. Utilizando os dados da Tabela 12.4, estime o modelo e interprete os resultados. 

b. Uma vez que o modelo content o regressando defasado como regressor, o teste d de 
Durbin-Watson nao e adequado para detectar se existe correlagao serial nos dados. Para 
tais modelos, chamados autorregressivos, Durbin formulou a chamada estatfstica li que 
visa detectar a autocorrelagao de primeira ordem, definida como:* 



em que n = tamanho da amostra, var (/S 3 ) = variancia do coeficiente da variedade defasada 
Y t _i defasado; p = estimativa da correlagao serial de primeira ordem. 

No caso de grandes amostras (em termos tecnicos, assintoticas), Durbin demonstrou que, 
sob a hipotese nula de p — 0, 


h ~ A(0, 1) 


isto e, a estatfstica h segue a distribuigao normal padrao. Com base nas propriedades de dis- 
tribuigao normal, sabemos que a probabilidade de | /z | > 1,96 e cerca de 5%. Portanto, se em 
uma aplicagao | h \ > 1,96, podemos rejeitar a hipotese nula de que p — 0, isto e, existem 
evidencias de autocorrelagao de primeira ordem no modelo autorregressivo. 

Para aplicar o teste, procedemos da seguinte forma: em primeiro lugar, estimamos o modelo 
referido por MQO (nao se preocupe com qualquer problema de estimativa nesta fase). Em 
segundo lugar , note a var(/1 3 ) neste modelo, bem como o d estatfstico calculado habitualmen- 
te. Terceiro, usando o valor d, obtenha /) ~ (I — d/2). E interessante notar que, embora nao 
possamos usar o valor d para testar a correlagao serial nesse modelo, podemos utiliza-lo 
para obter uma estimativa de p. Em quarto lugar, calculamos a estatfstica h. Em quinto 
lugar, se o tamanho da amostra for razoavelmente grande e se o | h calculado for superior 
a 1,96, podemos concluir que ha indfcios de autocorrelagao de primeira ordem. E claro que 
podemos usar o nivel de significancia que desejarmos. 

Aplique o teste h ao modelo autorregressivo de determinagao de salarios dado anteriormente, 
tire conclusoes adequadas e compare esses resultados com os da regressao (12.5.1). 

12.37. Variaveis dummy e autocorrelagao. Consulte a regressao de renda e poupanga discutida no 
Capftulo 9. Usando os dados apresentados na Tabela 9.2 e supondo um processo AR(1), es¬ 
time novamente a regressao renda-poupanga, tendo em conta a autocorrelagao. Preste 
especial atengao a transformagao da variavel binaria. Compare seus resultados com os apre¬ 
sentados no Capftulo 9. 

12.38. Usando os dados de salario-produtividade apresentados na Tabela 12.4, calcule o modelo 
(12.9.8) e compare seus resultados com os que figuram na regressao (12.9.9). Que con¬ 
clusoes podem ser tiradas? 


* DURBIN, J. "Testing for serial correlation in least-squares regression when some of the regressors are lagged 
dependent variables." Econometrica, v. 38, p. 410-421. 
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Apendice 12A 


12A.1 Prova de que o erro no termo v t na equa^ao 
(12.1.11) esta autocorrelacionado 


Desde que v, = u, — u ,_ t , e facil mostrar que E (v f ) = E (u, — u,_\) — E ( u,) — E (u r _{) = 0, desde 
que E (u) = 0, para cada t. Agora, a var (v,) = var (u, — m,_i) = var ( u,) + (w f _i) = 2a 2 , uma vez que 
a variancia de cada u, e a 2 e os a sao distribufdos independentemente. Daf, v t e homocedastico. Mas 

cov(v r , v,-i) = E(v t v t -i) = E[(u, - u t \)(u t i - u, 2 )] 

= -ff 2 

que, obviamente, nao e igual a zero. Assim, embora os u nao estejam autocorrelacionados, os v estao. 


12A.2 Prova das equates (12.2.3), (12.2.4) e (12.2.5) 

Sob AR(1), 


u, = pu t -1 + s, (1) 

Portanto, 

E{u t ) = pE(u t - 1 ) + E(s t ) = 0 (2) 

Assim, 

var(M ( ) = p 2 var(u,-i) + var(e ( ) (3) 

porque os u e e’s nao estao correlacionados. 

Desde que a var (m,) = var — a 2 e var (e f ) = er^, obtemos 

var («0= T f S 

1 - 

Agora multiplicamos a Equa§ao (1) por e tomamos as expectativas de ambos os lados para 
obter: 


COV {Uf, Uf- l) = E(u t u,-l)= E [pu]_ x + = p£(m 2 _!) 


Observando que a covariancia entre u,_, e e, e igual a zero (por que?) e que var ( u ,) = var = 
o^/(l — p 2 ), obtemos 

a 2 

COv(ll t , M,_i) = p--r- (5) 

(1 - p 7 ) ^ / 

Continuando desta forma, 

^2 

CO \(u t ,u t - 2 )= P 2 - - - 

(1 - p 2 ) 

, (T 2 

CO \(u t ,U t -l)= p — -t- 

(1 - P 2 ) 

e assim por diante. Agora, o coeficiente de correla 5 ao e a razao de covariancia em relapao a variancia. 
Por isso, 

cor(u t , u t - 1 ) = p cov(u t , u t - 2 ) = p 2 


e assim por diante. 










Capitulo 

Modelagem econometrica: 
especificagao de modelo e 
teste diagnostico 

Nao se pode aplicar os conceitos de econometria de um modo mecanico; e preciso compreensao, 
intuigao e habilidade. 1 

[...] em geral, atravessamos pontes sem nos preocuparmos com a solidez de sua construgao, porque 
temos confianga de que alguem verificou rigorosamente seus principios de engenliaria e pratica. Os 
economistas devem fazer o mesmo com modelos ou fazer a advertencia: “nao nos responsabilizamos se 
o uso provocar um acidente”. 2 

Ao longo dos anos, a busca dos economistas pela “verdade” levou a ideia de que sao pessoas que pro- 
curam um gato preto em uma sala escura (quando nao ha nenhum); e os econometristas costumam ser 
acusados de te-lo encontrado 3 

Uma das hipoteses do modelo classico de regressao linear (MCRL), a de numero 9, e que o mo¬ 
delo de regressao usado na analise esteja especificado “corretamente”: se o modelo nao for especifi- 
cado “corretamente”, teremos o problema de erro de especificagao de modelo ou vies de 
especificagao de modelo. Neste capitulo examinaremos a fundo essa hipotese, porque procurar o 
modelo correto e como buscar o Santo Graal. Em particular, examinaremos as seguintes questoes: 

1. Como se faz para encontrar o modelo “correto”? Em outras palavras, quais os criterios de 
escolha de um modelo para analise aplicada? 

2. Que tipos de erros de especificagao provavelmente encontraremos na pratica? 

3. Quais as consequencias dos erros de especificagao? 

4. Como sao detectados os erros de especificagao? Em outras palavras, quais as ferramentas de 
diagnostico que podemos empregar? 

5. Depois de detectar os erros de especificagao, que medidas podem ser adotadas e quais os 
beneficios que elas proporcionam? 

6 . Como se avalia o desempenho de modelos altemativos? 

A especificacjao e avaliaijao de modelos e um topico vasto e tem sido realizados extensos traba- 
lhos empiricos nesta area. Alem disso, ha diferengas filosoficas a respeito do assunto. Embora nao 



1 CUTHBERTSON, Keith; HALL, Stephen G.; TAYLOR, Mark P. Applied econometrics techniques. Michigan University 
Press, 1992. p. 68. 

2 HENDRY, David F. Dynamic econometrics. Reino Unido: Oxford University Press, 1995. p. 68. 

3 KENNEDY, Peter. A guide to econometrics. 3. ed. Cambridge, Mass.: The MIT Press, 1992. p. 82. 
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possamos fazer plena justi^a a esse topico em apenas um capftulo, esperamos tratar de algumas ques- 
toes fundamentals envolvidas na especificafao e avalia 9 ao do modelo. 


13.1 Criterios de seletiao de modelos 

De acordo com Hendry e Richard, um modelo escolhido para analise aplicada deve satisfazer os 

seguintes criterios: * * * 4 

1. Ser confinnado pelos dados', as previsoes feitas com base no modelo devem ser logicamente 
possfveis. 

2. Ser consistente com a teoria; ele deve fazer sentido do ponto de vista economico. Por exemplo, 
se a hipotese de renda permanente de Milton Friedman for valida, o valor do intercepto na re- 
gressao do consumo permanente contra a renda permanente deve ser igual a zero. 

3. Ter regressores fracamente exogenos; as variaveis explanatorias, oil regressores, nao devem ser 
correlacionadas com o termo de erro. Pode-se acrescentar que em algumas situa 9 oes os regres¬ 
sores exogenos podem ser estritamente exogenos. Uma variavel estritamente exogena e inde- 
pendente de valores correntes, futuros e passados do termo de erro. 

4. Exibir constancia dos parametros; os valores dos parametros devem ser estaveis. Caso contrario, sera 
dificil fazer uma previsao. Como observa Friedman: “O tinico teste relevante da validade de uma hi¬ 
potese [modelo] e a comparayao de suas previsoes com a experiencia”. 5 Na ausencia de constancia 
dos parametros, as previsoes nao serao confiaveis. 

5. Mostrar consistencia de dados', os resfduos estimados do modelo devem ser puramente aleato- 
rios (tecnicamente, rufdos brancos). Em outras palavras, se o modelo de regressao for adequado, 
os residuos desse modelo devem ser ruidos brancos. Se esse nao for o caso, ha algum erro de 
especificaqiao no modelo. Logo iremos explorar a natureza dos erros de especificaijao. 

6 . Ser abrangente', o modelo deve abanger ou incluir todos os modelos concorrentes no sentido de que 
seja capaz de explicar seus resultados. Em resumo, os outros modelos nao podem ser mais aprimo- 
rados que o modelo escolhido. 

Uma coisa e relacionar os criterios de “bom” modelo e outra e desenvolve-lo; na pratica, e prova- 

vel que se cometam varios erros de especifica 9 ao de modelo, discutidos na proxima sepao. 


13.2 Tipos de erros de especifica^ao 

Suponha que, com base nos criterios relacionados, cheguemos a um modelo que aceitamos como 
satisfatorio. Para darmos um exemplo concreto, seja este modelo 

Yj — Pi + + ^4X^1 + Mi; (13.2.1) 

em que Y = custo total de produ 9 ao eX = prodiujao. A Equapao (13.2.1) e o exemplo conhecido de 
uma fun 9 ao cubica de custo total. 

Mas suponha que, por alguma razao (por exemplo, pregui 9 a de fazer o diagrama de dispersao) um 
pesquisador decida usar o seguinte modelo: 

Yi = a 1 + a 2 Xj + a 3 Xf + u 2i (13.2.2) 


4 HENDRY, D. F.; Richard, J. F. "The econometric analysis of economic time series." International Statistical Review, 
1983. v. 51, p. 3-33. 

5 FRIEDMAN, Milton. "The methodology of positive economics." In: Essays in positive economics. Chicago: University 
of Chicago Press, 1953. p. 7. 
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Observe que mudamos a notagao para distinguir esse modelo do verdadeiro. 

Ja que pressupomos que a Equagao (13.2.1) seja verdadeira, adotar a Equagao (13.2.2) constitui- 
ria um erro de especificagao, e o erro consiste na omissao de uma variavel relevante (Xj). Portanto, 
o termo de erro i/ 2 , na Equagao (13.2.2) e, de fato, 


u 2i = uu + faX] 


(13.2.3) 


Veremos em breve a importancia dessa relagao. 

Agora suponha que outro pesquisador use o seguinte modelo: 

Yj = Aj + A 2 A) + h^X] + ^-^X] + hsX] + UT,i 


(13.2.4) 


Se a Equagao (13.2.1) for a “verdadeira”, a Equagao (13.2.4) tambem constituira um erro de especifi¬ 
cagao, que consiste em incluir uma variavel desnecessaria ou irrelevante, no sentido de que o ver¬ 
dadeiro modelo pressupoe que X 5 seja igual a zero. O novo termo de erro e, de fato, 


«3 i - Mli — ^-sXf 

= u\i ja que as = 0 no modelo verdadeiro (Porque?) 
Agora suponha ainda que outro pesquisador postule o seguinte modelo: 

In Yj = y\ + YiXj + YiX] + y^X] + u 4; 


(13.2.5) 


(13.2.6) 


Em relagao ao modelo verdadeiro, a Equagao (13.2.6) tambem constituiria vies de especificagao, 
sendo este o uso da forma funcional errada: na Equagao (13.2.1) Y aparece linearmente, enquanto 
na Equagao (13.2.6) ele aparece de forma log-linear. 

Por fim, considere o pesquisador que usa o seguinte modelo: 



(13.2.7) 


em que Y* = Y t + e, e X , — X t + w„ e, e w, representam erros de medida. O que a Equagao (13.2.7) diz 
e que, em vez de usarmos os verdadeiros Y, e X t estamos usando suas proxies, Y , e X), que podem 
conter erros de medida. Portanto, na Equagao (13.2.7), cometemos o vies de erro de medida. Em 
trabalhos aplicados, os dados sao repletos de erros de aproximagao ou erros de cobertura incompleta 
ou, apenas, de omissao de algumas observagoes. Nas ciencias sociais, dependemos com frequencia de 
dados secundarios e em geral nao temos como conhecer os tipos de erros, se houver, cometidos pelo 
orgao encarregado da coleta dos dados primarios. 

Outro tipo de erro de especificagao relaciona-se a forma como o erro estocastico «,■ (ou u t ) entra 
no modelo de regressao. Considere, por exemplo, o seguinte modelo de regressao bivariado sem o 
termo de intercepto: 


Y, = px t Ui 


(13.2.8) 


em que o termo de erro estocastico entra de forma multiplicativa com a propriedade de que m, satisfaz 
as hipoteses do modelo classico de regressao linear em comparagao com o seguinte modelo: 


Yj = otXj + Uj 


(13.2.9) 


em que o termo de erro entra de forma aditiva. Embora as variaveis sejam as mesmas nos dois mo- 
delos, denotamos o coeficiente angular na Equagao (13.2.8) por /3 e o coeficiente angular na Equagao 
(13.2.9) por a. Agora se a equagao (13.2.8) for o modelo “correto” ou “verdadeiro”, estimar a nos 
daria uma estimativa nao tendenciosa do verdadeiro fal Isto e E(a) — fa Se esse nao for o caso, a es¬ 
pecificagao estocastica impropria do termo de erro constituira outra causa de erro de especificagao. 
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Um erro de especificagao que as vezes e desprezado e a interagao entre os regressores, isto e, o 
efeito multiplicativo de um ou mais regressores no regressando. Para ilustrar, considere a seguin- 
te fungao salario simplificada: 


In Wj = P\ + @2 Educagao, + ^Genero, 

+ /^4 (Educagao,) (Genero/) + m, (13.2.10) 

Nesse modelo, a mudanga nos salarios relativos com respeito a educagao depende nao so da edu¬ 
cagao, mas tambem do genero ( aEducagao = ft + P‘, Genero). Da mesma forma, a mudanga nos sala¬ 
rios relativos com relagao ao genero depende nao so deste, mas tambem da educagao. 

Para resumir, ao desenvolver um modelo aplicado, e provavel que se cometa um ou mais dos se- 
guintes erros de especificagao: 

1. Omissao de uma ou mais variaveis relevantes. 

2. Inclusao de uma ou mais variaveis desnecessarias. 

3. Adogao da forma funcional errada. 

4. Erros de medida. 

5. Especificagao incorreta do termo de erro estocastico. 

6 . Pressuposigao de que o termo de erro tem distribuigao normal. 

Antes de passar a examinar esses erros de especificagao detalhadamente, convent distinguir entre 
erros de especificagao de modelo e erros de especificagao equivocada de modelos. Os quatro pri- 
meiros tipos de erro discutidos sao de especificagao do modelo por natureza, pois temos em mente 
um modelo “verdadeiro”, mas de algum modo nao estimamos o modelo correto. Nos erros de estima- 
gao equivocada, nao sabemos qual e o verdadeiro modelo. Nesse contexto, podemos relembrar a 
controversia entre keynesianos e os monetaristas. Estes dao primazia a moeda para explicar variagoes 
no P1B, enquanto os keynesianos ressaltam o papel das despesas do governo para explicar essas va¬ 
riagoes. Eles poderiam ser considerados modelos concorrentes. 

Consideraremos a seguir os modelos com erros de especificagao e examinaremos os erros dos 
modelos mal especificados. 


13.3 Consequencias dos modelos com erros de especificagao 

Quaisquer que sejam as origens dos erros de especificagao, quais sao as consequencias? Para nao 
complicarmos a discussao, responderemos a essa pergunta no contexto do modelo de tres variaveis 
e consideraremos nesta segao os dois primeiros tipos de erros de especificagao discutidos anterior- 
mente, a saber, (1) modelos sub-especificados, isto e, omissao de variaveis relevantes e (2) mode¬ 
los sobre-especificos, isto e, inclusao de variaveis irrelevantes. Nossa discussao aqui pode ser 
facilmente generalizada para mais de dois regressores, mas com calculos algebricos cansativos; 6 a 
algebra matricial torna-se quase uma necessidade, quando vamos alem de casos com tres variaveis. 

Omissao de uma variavel relevante (subespecifica^ao) 

Suponha que o verdadeiro modelo seja: 

Yi - P\ + PzX2\ + PiXn + Ui ( 13 . 3 . 1 ) 

mas por alguma razao ajustamos o seguinte modelo: 

Yi - a i + 0 : 2 X 2 , + v; 


6 No entanto, vale consultar o Exercfcio 1 3.32. 


( 13 . 3 . 2 ) 
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As consequencias de omitir a variavel X 3 sao as seguintes: 

1. Se a variavel nao incluida ou omitida X 3 estiver correlacionada com a variavel inclufda X 2 , 
isto e, r 23 , o coeficiente de correla^ao entre as duas variaveis nao sera zero e iq e a 2 serao 
tendenciosos e inconsistentes. Isto e, E(a t ) f e E(a 2 ) f f 2 , e o vies nao desaparecera 
quando o tamanho da amostra aumentar. 

2. Mesmo que X 2 e X 3 nao sejam correlacionados, iq e tendencioso, embora a 2 agora nao seja 
tendencioso. 

3. A variancia do termo de erro a 2 esta estimada incorretamente. 

4. A variancia medida de modo convencional de a 2 (= cr 2 / ^ x| ( ) e um estimador tendencioso 
f 2 da variancia do verdadeiro estimador . 

5. Em consequencia, os procedimentos habituais para determinar os intervalos de confian 9 a e o 
teste de hipoteses provavelmente conduzirao a conclusoes equivocadas quanto a significance 
estatfstica dos parametros estimados. 

6. Outra consequencia e que as previsoes baseadas no modelo incorreto e os intervalos de pre- 
visao (confian^a) nao serao confiaveis. 

Embora a demonstra 9 ao de cada um desses pontos va muito alem do escopo deste livro, 7 mostra- 
mos no Apendice 13A, Se 9 ao 13A.1, que 

E(&i) = fa + Pib 22 (13.3.3) 

em que b 22 e o coeficiente angular na regressao da variavel excluida X 2 contra a variavel inclufda 
X 2 (b 2 2 =52 x 3i x 2i75Z x 2i )- Como mostra a Equa 9 ao (13.3.3), a 2 e tendencioso, a menos que /? 3 ou 
b 22 ou ambos sejam iguais a zero. Descartamos a possibilidade de /J 3 ser zero, porque, antes de mais 
nada, nesse caso nao temos erro de especifica 9 ao. O coeficiente b 22 sera zero se X 2 e X 2 nao forem 
correlacionados, o que e improvavel na maioria dos dados economicos. 

Em geral, a extensao do vies dependera do termo de vies /f 3 /? 32 . Se, por exemplo, /J 3 for positivo 
(A 3 tiver efeito positivo em Y) e b i2 for positivo (X 2 e X 3 forem correlacionados positivamente), a 2 , 
em media, ira superestimar o verdadeiro ft 2 (vies positivo). Mas esse resultado nao deveria surpreender, 
pois X 2 representa nao so seu efeito direto sobre Y, mas tambem seu efeito indireto (via X 3 ) sobre Y. 
Em resumo, X 2 tem credito pela influencia que seria atribuida corretamente a X 3 , sendo este impedi- 
do de mostrar seus efeitos explicitamente, porque nao lhe foi “permitido” entrar no modelo. Como 
exemplo concreto, considere o discutido no Capitulo 7 (Exemplo 7.1). 


EXEMPLO 13.1 

Exemplo 
ilustrativo: 
retomando a 
mortalidade 
infantil 


Fazendo a regressao da mortalidade infantil (Ml) contra o PNB per capita (PNBpc) e a 
taxa de alfabetizafao feminina (TAF), obtivemos os resultados da Equagao (7.6.2), dan- 
do os valores dos coeficientes parciais angulares das duas variaveis como —0,0056 e 
—2,2316, respectivamente. Mas, se agora excluirmos a variavel TAF, obtemos os resul¬ 
tados mostrados na Equa 9 ao (7.7.2). Se consideramos a Equagao (7.6.2) como o mo¬ 
delo correto, entao a Equafao (7.7.2) sera um modelo com espeficiafao equivocada, 
pois omite a variavel relevante TAF. Agora voce pode ver que no modelo correto o 
coeficiente da variavel PNBpc era - 0,0056, enquanto no modelo "incorreto" (7.7.2) 
agora e —0,0114. 

( Continua ) 


7 Para um tratamento algebrico, veja KMENTA, Jan. Elements of econometrics. Nova York: Macmillan, 1971, 
p. 391-399. Aqueles que tiverem formagao em algebra matricial podem consultar JOHNSTON, J. Econometrics 
methods. 4. ed., Nova York: McGraw-Hill, 1997, p. 119-112. 
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EXEMPLO 13.1 

( Continuagao) 


Em termos absolutos, agora o PNBpc tem um impacto maior na Ml comparado ao mo- 
delo verdadeiro, mas, se efetuamos a regressao da TAF contra o PIBpc(regressao da variavel 
contra a variavel inclufda), o coeficiente angular nessa regressao (fa 32 em termos da Equa^ao 
(1 3.3.3)) sera 0,00256. 8 Isso sugere que, quando o PIBpc aumenta em uma unidade, em 
media, a TAF sobe 0,00256 unidades. Mas, se a TAF subir nesse montante, seu efeito na Ml 
sera (-2,2316) (0,00256) = p 3 b 32 = -0,00543. 

Portanto, da Equa^ao (1 3.3.3) temos + Zb £> 32 ) = [—0,0056 + (—2,2316)(0,00256)] 

—0.0111, que e o valor do coeficiente do PNBpc obtido no modelo incorreto (7.7.2). 9 
Como ilustra este exemplo, o verdadeiro impacto do PIBpc sobre a Ml e muito menor 
(—0,0056) do que o sugerido pelo modelo incorreto (7.7.2), a saber, (—0,0114). 


Agora, vamos examinar as variancias de a 2 e 


a 2 


var(a 2 ) - 

2^ x 2i 

(13.3.4) 

2 2 

O O 


E4(!-q 2 3 ) E4, F 

(13.3.5) 


em que FIV (uma medida da colinearidade) e o fator de inflaqao da variancia [ = 1/(1 — r 23 )] dis- 
cutido no Capftulo 10 e r 23 e o coeficiente de correla^ao entre as variaveis X 2 e V 3 ; conhecemos as Equa- 
£oes (13.3.4) e (13.3.5) dos Capftulos 3 e 7. 

Como as formulas (13.3.4) e (13.3.5) nao sao identicas, em geral a var (a 2 ) sera diferente da var 
(fi 2 ). Mas sabemos que a var (f> 2 ) e nao tendenciosa. (Por que?) Portanto, a var (u 2 ) e tendenciosa, 
confirmando, desse modo, a afirmaqao feita no item 4 anterior. Uma vez que 0 < r 23 < 1, poderia 
parecer que, neste caso, var (d 2 ) < var (/T). Agora enfrentamos um dilema: embora u 2 seja tendencio- 
so, sua variancia e menor que aquela do estimador nao tendencioso P 2 (e claro que estamos descar- 
tando o caso em que r 23 — 0, ja que na pratica ha correla£ao entre os regressores). Ha um trade-off 
envolvido aqui. 10 

Porem, a historia nao terminou, pois o a 2 estimado do modelo (13.3.2) e aquele estimado do mo¬ 
delo verdadeiro (13.3.1) nao sao os mesmos, uma vez que a soma dos quadrados dos residuos (SQR) 
dos dois modelos e seus graus de liberdade (gl) sao diferentes. Voce pode recordar que obtemos uma 
estimativa de a 1 como rr 2 = SQR/gl, que depende do niimero de regressores incluidos no modelo, 
bem como dos gl ( = n, numero de parametros estimados). Agora, se acrescentamos variaveis ao 
modelo, o SQR em geral diminui (lembre-se de que, a medida que mais variaveis forem acrescentadas 
ao modelo, o R 2 aumenta), mas os graus de liberdade diminuem porque sao estimados mais parame¬ 
tros. A diminuifao do SQR podera ou nao ser suficiente para compensar a perda dos graus de liber¬ 
dade devido a adi?ao dos regressores; o resultado liquido dependera dessa diminui?ao. E bem 
possivel que, se um regressor tiver um forte impacto sobre o regressando — por exemplo, ele pode 
reduzir o SQR mais do que a perda dos graus de liberdade como resultado de sua adi?ao ao modelo —, 
a inclusao de tais variaveis nao so reduzira o vies, mas tambem aumentara a precisao (reduzira os 
erros padrao) dos estimadores. 


8 Os resultados da regressao sao: 

TAF= 47,5971 + 0,00256PNBpc 
ep= (3,5553) (0,0011) r 2 = 0,0721 

9 Note que nos verdadeiros modelos de fi 2 e /h estao as estimativas nao tendenciosas de seus verdadeiros valores. 

10 Para contornar o trade-off entre vies e eficiencia, poderfamos escolher minimizar o quadrado do erro medio 

(QEM), visto que ele responde tanto pelo vies quanto pela eficiencia. Sobre o QEM, veja o apendice estatfstico 
(Apendice A). Veja tambem o Exercfcio 1 3.6. 
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Por outro lado, se as variaveis relevantes tiverem um impacto apenas marginal sobre o regressando 
e se estiverem altamente correlacionadas (se o FIV for maior), poderemos reduzir o vies nos coeficien- 
tes das variaveis ja incluidas no modelo, mas aumentar seus erros padrao (torna-los menos eficientes). 
De fato, o trade-off nesta situagao entre vies e precisao pode ser substancial. Como podemos ver, o 
trade-off depended da importancia relativa dos varios regressores. 

Para concluirmos, vamos considerar o caso especial em que r 23 = 0, isto 6 X 2 eX 3 nao estao cor- 
relacionados. Isso resultara em b 32 igual a zero (por que?). Portanto, podemos ver, com base em 
(13.3.3), que agora a 2 e nao tendencioso. 11 Alem disso, parece, das Equagdes (13.3.4) e (13.3.5), que 
as variancias de a 2 e ff sao iguais. Havera problema em excluir a variavel X 3 do modelo, embora 
teoricamente ela possa ser relevante? Em geral a resposta e nao, pois, neste caso, como observado 
anteriormente, a var (d 2 ) estimada da Equagao (13.3.4) ainda sera tendenciosa e, portanto, nossos 
procedimentos de teste de hipoteses provavelmente permanecerao pouco confiaveis. 12 Alem disso, na 
maioria das pesquisas economicas, X 2 e X 3 serao correlacionados, criando os problemas discutidos 
anteriormente. Esta claro que, uma vez que um modelo e formulado com base na teoria relevante, 
nao e aconselhavel excluir uma variavel desse modelo. 

Inclusao de uma variavel irrelevante (sobre-especificagao) 

Agora vamos supor que 

Yt = P\ + faXu + Ui (13.3.6) 

seja o modelo verdadeiro, mas que ajustamos o seguinte: 

Yi = a i + a 2 X 2i + a 3 X 3i + v, (13.3.7) 

e assim cometemos o erro de especificagao de incluir uma variavel desnecessaria no modelo. 

As consequencias desse erro de especificagao sao: 

1. Os estimadores de MQO dos parametros do modelo “incorreto” sao todos nao tendenciosos 
e consistentes, isto e E{a\) — fi\, E(a 2 ) — fi 2 e E(d 3 ) = ft 3 = 0. 

2. A variancia do erro a 2 e estimada corretamente. 

3. Os intervalos de confianga e os procedimentos de teste de hipoteses habituais permanecem 
validos. 

4. Entretanto, os a estimados em geral serao ineficientes; suas variancias em geral serao maio- 
res que aquelas dos fi do modelo verdadeiro. As demonstragoes de algumas dessas afirmati- 
vas podem ser encontradas no Apendice 13A, Segao 13A.2. O que nos interessa aqui e a 
relativa ineficiencia dos a, e isto pode ser mostrado facilmente. 


Da formula habitual de MQO, sabemos que: 


~ er 2 

var (A)= v 2 

(13.3.8) 

var< “ 2,= E4C -?,) 

(13.3.9) 


Portanto, 


11 Note,_no entanto, que dj ainda e tendencioso, o^ue pode ser visto intuitivamente como segue: sabemos que 
j3 3 = Y — P 2 X 2 — P 1 X 1 , enquanto a-[ = Y — a 2 X 2 , e mesmo que ^ = p 2 , os dois estimadores do intercepto 
serao diferentes. 

12 Para maiores detalhes, veja DARNELL, Adrian C. A dictionary of econometrics Edward Elgar Publisher, 1994. 
p. 371-372. 
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var (d^) 1 

var(jS 2 ) 1 “ r 2 3 


(13.3.10) 


Como 0 < r 23 < 1, segue-se que a var (a 2 ) > var (/i 2 ); isto e, a variancia de a 2 em geral e maior do 
que a variancia de /f 2 embora, em media, a 2 = fi 2 [i.e., E(a 2 ) = fi 2 ]. 

Essa constata^ao implica que a inclusao da variavel desnecessaria X 2 torna a variancia de a 2 maior 
do que o necessario, tornando u 2 menos preciso. Isso tambem vale para 

Note a assimetria nos dois tipos de vies de especificatjao considerados. Se excluimos uma variavel 
relevante, os coeficientes das variaveis mantidas no modelo em geral serao tendenciosos e inconsisten- 
tes, a variancia do erro sera estimada incorretamente, e os procedimentos usuais de teste de hipotese se 
tornarao invalidos. Por outro lado, a inclusao de uma variavel irrelevante no modelo ainda nos da esti- 
mativas nao tendenciosas e consistentes dos coeficientes no modelo verdadeiro, a variancia do erro e 
estimada corretamente e os metodos convencionais de teste de hipoteses continuam validos; a unica 
desvantagem que ocorre com a inclusao da variavel superflua e que as variancias estimadas dos coefi¬ 
cientes aumentam e, como resultado, nossas inferences probabilfsticas sobre os parametros sao menos 
exatas. Uma conclusao indesejada aqui seria que e melhor incluir variaveis irrelevantes que omitir as 
relevantes, mas essa filosofia nao deve ser adotada, porque a adipao de variaveis desnecessarias levara 
a perda da eficiencia dos estimadores e pode acarretar tambem o problema de multicolinearidade (por 
que?), para nao mencionar a perda de graus de liberdade. Portanto, 


Em geral, a melhor abordagem e incluir apenas variaveis explanatorias que, em termos teoricos, 
influenciam diretamente a variavel dependente e que nao sao explicadas pelas outras variaveis 
inclufdas . 13 


13.4 Testes dos erros de especificagao 

Saber as consequencias dos erros de cspecificaqao e uma coisa, mas descobrir se esses erros foram 
cometidos e outra bem diferente, pois nao nos dispomos deliberadamente a cometer esses erros. Com 
muita frequencia os vieses de especificapao surgem inadvertidamente, talvez devido a nossa incapa- 
cidade de formular o modelo com a maxima precisao possivel, uma vez que a teoria subjacente e 
inconsistente ou porque nao temos os dados adequados para testar o modelo. Como observa Davidson, 
“devido a natureza nao experimental da economia, nunca temos certeza de como os dados observados 
foram gerados. O teste de qualquer hipotese em economia sempre depende de hipoteses adicionais 
necessarias para especificar um modelo razoavelmente parcimonioso, que pode ou nao pode ser 
justificado ’’. 14 

A questao pratica entao nao e por que cometemos erros de especificapao, pois em geral isso acon- 
tece, mas sim como detecta-los. Uma vez constatados erros de especificapao, as formas de corrigi-los 
aparecem. Se, por exemplo, podemos mostrar que uma variavel foi omitida inadequadamente de um 
modelo, a correcao obvia e inclui-la na analise, supondo, evidentemente, que os dados sobre a varia¬ 
vel estejam disponfveis. 

Nesta seqao discutiremos alguns testes que podemos usar para detectar erros de especificapao. 

Detectando a presen^a de variaveis desnecessarias 

Suponha que tenhamos desenvolvido um modelo com k variaveis para explicar um fenomeno: 

Yi = fi i + PiX 2i + -E f} k X ki + ui (13.4.1) 


13 INTRILIGATOR, Michael D. Econometric models, techniques and applications, Englewood Cliffs, NJ: Prentice Hall, 
1978, p. 189. Lembre-se do Occam's razor principle. 
u DAVIDSON, James. Econometric theory. Oxford, Reino Unido: Blackwell Publishers,2000, p. 153. 
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Entretanto, nao temos certeza de que a variavel X k realmente pertence ao modelo. Uma maneira 
simples de descobrir e testar a significancia do /S A . estimado com o teste 1 usual: t — file p (/y. Mas 
suponhamos que nao estejamos certos de que, por exemplo, A 3 e X 4 pertencem legitimamente ao 
modelo. Podemos verificar facilmente aplicando o teste F discutido no Capftulo 8. Detectar a presen- 
ga de uma variavel (ou variaveis) irrelevante nao e uma tarefa diffcil. 

No entanto, e muito importante lembrar que, ao realizarmos esses testes de significancia temos um 
modelo especifico em mente. Aceitamos que esse modelo representa a hipotese mantida ou a “ver- 
dadeira”, por mais precaria que possa ser. Dado esse modelo, podemos descobrir se um ou mais re- 
gressores sao realmente relevantes aplicando os testes t e F habituais. Mas observe cuidadosamente 
que nao deverfamos usar os testes t e F iterativamente para construir um modelo; nao deverfamos 
dizer que inicialmente Y esta relacionado com X 2 so porque f$ 2 e estatisticamente significativo e entao 
expandir o modelo para incluir X 3 e decidir manter essa variavel no modelo se for estatisticamente 
significativo e assim por diante. Essa estrategia de construgao de um modelo e chamada de abordagem 
de baixo para cima (comega com um modelo menor, expandindo-o gradativamente), tambem referida 
de maneira pejorativa como data mining (garimpagem de dados). Outros nomes que ela recebe sao 
regression fishing , data grubbing , data snooping e number crunching. 

O objetivo basico de data mining e desenvolver o “melhor” modelo apos os diversos testes diagnos- 
ticos, de modo que o modelo escolhido no final seja um “bom” modelo, no sentido de que todos os 
coeficientes estimados tenham os sinais “corretos”, sejam estatisticamente significativos com base 
nos testes t e F, apresentem um valor R 1 razoavelmente alto e um valor aceitavel para o d de Durbin- 
-Watson (em torno de 2) etc. Os puristas desprezam a pratica de data mining. Nas palavras de William 
Pool, “[...] e sempre perigoso fazer da regularidade aplicada a base, em vez da implicagao da teoria 
economica”. 15 Segue uma razao para “condenar” o data mining. 

Nivel de significancia nominal versus nivel verdadeiro na presence de data mining 

Um dos perigos no data mining que o pesquisador desavisado enfrenta e que os nfveis convencio- 
nais de significancia (a) como 1, 5 ou 10% nao sao os verdadeiros nlveis de significancia. Lovell 
sugeriu que, se ha c regressores candidatos dentre os quais k sao finalmente selecionados ( k < c) com 
base no data mining, o verdadeiro nivel de significancia (a*) esta relacionado ao nivel nominal de 
significancia (a) como se segue: 16 


a* = 1 - (1 - a) c ' k 


(13.4.2) 


ou aproximadamente como 

a = (c/ k)a (13.4.3) 

Por exemplo, se c = 15, k = 5, e a — 5%, de acordo com a Equagao (13.4.3) o verdadeiro nivel 
de significancia e (15/5)(5) = 15%. Portanto, se um pesquisador usa a pratica do data mining e se- 
leciona 5 de 15 regressores e relata apenas os resultados do modelo condensado ao nivel de signifi¬ 
cancia nominal de 5% e declara que os resultados sao estatisticamente significativos, deve-se 
considerar essa conclusao com certa cautela, pois sabemos que o verdadeiro nivel de significancia e, 
de fato, 15%. Deve-se notar que, se c — k, nao ha data mining ; os niveis de significancia verdadeiro 
e nominal sao os mesmos. Evidentemente, na pratica a maioria dos pesquisadores relata apenas os 
resultados de sua regressao “final” sem revelar necessariamente todo o data mining, ou o pre-teste, 
que foi feito. 17 


15 POOL, William. "Is inflation too low?" The Cato Journal, v. 18, n. 3, p. 456, 1999. 

16 LOVELL, M. "Data mining." Review of Economics and Statistics, v. 65, p. 1-12, 1983. 

17 Para uma discussao detalhada de pre-teste e os vieses que este pode acarretar, veja WALLACE, T. D. "Pretest 
estimation in regression: a survey." American Journal of Agricultural Economics, v. 59, p. 431 -443, 1977. 
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Apesar de suas desvantagens obvias, ha um reconhecimento crescente, principalmente entre os 
profissionais que trabalham com econometria aplicada, de que a abordagem purista (contraria ao 
data mining ) a construfao do modelo nao e sustentavel. Como observa Zaman: 

Infelizmente, a experiencia com dados reais mostra que tal abordagem nao e viavel nem desejavel. Nao 
e viavel, porque e uma teoria economica rara, que leva a um modelo unico. Nao e desejavel, porque um 
aspecto crucial da aprendizagem dos dados e entender que tipos de modelos sao e nao sao apoiados por 
dados. Mesmo que, por rara sorte, os modelos iniciais mostrem-se adequados, com frequencia e impor- 
tante explorar e identificar que tipos de modelos adaptam-se ou nao aos dados. 18 

Kerry Patterson expressa uma visao semelhante, sustentando que: 

Esta abordagem [data mining ] sugere que a teoria economica e a especificacao aplicada [deveriam in- 
teragir] em vez de serem mantidas separadas. 19 

Em vez de examinarmos detidamente na controversia sobre a abordagem de data mining versus 
purista na constru^ao do modelo, podemos endossar a visao expressa por Peter Kennedy: 

[Essa especificacao de modelo] precisa ser uma combinacao bem ponderada de teoria e dados, e esses 
procedimentos de teste usados na busca de especificacao deveriam ser definidos para minimizar os 
custos de data mining. Exemplos de tais procedimentos sao a separaqao de dados para testes de previsao 
fora da amostra, ajuste de niveis de significancia [a la Lovell], e evitar criterios questionaveis como 
maximizar R 2 . 20 

Se examinarmos o data mining em uma perspectiva mais ampla como um processo de descoberta 
de regularidades aplicadas que poderiam sugerir erros e/ou omissoes em modelos teoricos (existen- 
tes), ele tem um papel muito util a desempenhar. Citando Kennedy novamente, “a arte do econome- 
trista aplicado consiste em levar em conta uma teoria voltada para os dados enquanto evita os perigos 
consideraveis no data mining”. 21 


Testes para omissao de variaveis e forma funcional incorreta 

Na pratica nunca temos certeza de que o modelo adotado para teste aplicado e “a verdade, somente a 
verdade, nada mais que a verdade”. Com base na teoria ou na introspeccao e em trabalhos aplicados, 
desenvolvemos um modelo que acreditamos captar a essencia do assunto estudado. Submetemos o 
modelo ao teste aplicado. Depois de obtermos os resultados, comecamos a dissecaqao, tendo em mente 
os criterios de um bom modelo discutido anteriormente. E nessa etapa que sabemos se o modelo escolhi- 
do e adequado. Ao determinarmos a adcquayao do modelo, examinamos alguns aspectos amplos dos re¬ 
sultados, como o valor do R 2 , as razoes t estimadas, os sinais dos coeficientes estimados em relacao as 
expectativas anteriores, a estatistica de Durbin-Watson e outros. Se esses diagnosticos forem razoa- 
veis, afirmamos que o modelo escolhido e uma representacao adequada da realidade. Seguindo o 
mesmo raciocfnio, se os resultados nao forem animadores, porque o valor de R 2 e muito baixo ou 
porque muito poucos coeficientes sao estatisticamente significativos ou tem os sinais corretos 
ou porque o d de Durbin-Watson e muito baixo, comccamos a ficar preocupados com a adequa^ao 
do modelo e procuramos formas de corrigi-lo: talvez tenhamos omitido uma variavel importante, ou 
usamos a forma funcional errada ou ainda nao calculamos a primeira difercnca da serie temporal 
(para remover a correlaqao serial) e assim por diante. Para auxiliar a determinar se a inadequafao do 
modelo deve-se a esses problemas, podemos usar os metodos a seguir. 


18 ZAMAN, Asad. Statistical foundations for econometric techniques. Nova York: Academic Press, 1996. p. 226. 

19 PATTERSON, Kerry. An introduction to applied econometrics. Nova York: St. Martin's Press, 2000. p. 10. 

20 KENNEDY, Peter. "Sinning in the basement: what are the rules? The ten commandments of applied econometrics." 
Manuscrito nao publicado. 

21 KENNEDY, op. cit., p. 13. 
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Exame de residuos 

Como se discutiu no Capitulo 12, o exame dos residuos e um bom diagnostico visual para detectar 
a autocorrelagao ou a heterocedasticidade. Mas esses residuos tambem podem ser examinados, prin- 
cipalmente, em dados de corte transversal para detectar erros de especificagao de modelo, como a 
omissao de uma variavel importante ou de uma forma funcional incorreta. Se de fato esses erros fo- 
ram cometidos, um grafico dos residuos mostrara padroes distintos. 

Para ilustrarmos, reconsideraremos a fungao cubica de custo total vista no Capitulo 7. Suponha 
que a verdadeira fungao de custo total seja descrita como se segue, em que Y = custo total e X = 
produgao: 

Yi= Pi + PiXi + PiXf + P^X] + Ui (13.4.4) 

mas um pesquisador ajuste a seguinte fungao quadratica: 

Y, — ai + 0 / 2 X 1 + + U2i (13.4.5) 

e outro pesquisador ajuste a seguinte fungao linear: 

Yi = X 1 + A.2 Xi + «3, (13.4.6) 

Embora saibamos que os dois pesquisadores cometeram erros de especificagao, para fins pedago- 
gicos vejamos como os residuos estimados aparecem nos tres modelos. (Os dados de custo-produgao 
estao na Tabela 7.4.) A Figura 13.1 mostra claramente que a medida que nos movemos da esquerda 
para a direita, nos aproximamos da verdade; nao so os residuos sao menores (em valores absolutos), 
mas eles nao exibem as oscilagoes ciclicas pronunciadas, associadas aos modelos mal ajustados. 

Portanto, fica claro que vale examinar o grafico dos residuos: se houver erros de especificagao, os 
residuos exibirao padroes marcantes. 

A estatistica d de Durbin-Watson mais uma vez 

Se examinarmos o d de Durbin-Watson calculado na Tabela 13.1, vemos que para a fungao linear 
de custo o d estimado e 0,716, sugerindo que ha “correlagao positiva nos residuos estimados: para 
n — 10 e k' — 1, os valores criticos de d sao d L — 0,879 e d LJ — 1,320. Da mesma forma, o valor de d 
calculado na fungao de custo quadratico e 1,038, enquanto os valores criticos a 5% sao d, = 0,697 e 
d v = 1,641, indicando indecisao. Mas, se usamos o teste d modificado (veja Capitulo 12), pode- 


FIGURA 13.1 

Residuos Uj de 
fungoes de custo total 
(a) linear, ( b ) 
quadratica e (c) 
cubica. 


“i 
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TABELA 13.1 

Resfduos estimados 
das fun§oes linear, 
quadratica e cubica de 
custo total 


Numero da 

Ui, 

W /, 

W/, 

observafao 

modelo linear* 

modelo quaraticol 

modelo cubico' 

1 

6,600 

-23,900 

-0,222 

2 

19,667 

9,500 

1,607 

3 

13,733 

18,817 

-0,915 

4 

-2,200 

13,050 

-4,426 

5 

-9,133 

11,200 

4,435 

6 

-26,067 

-5,733 

1,032 

7 

-32,000 

-16,750 

0,726 

8 

-28,933 

-23,850 

-4,119 

9 

4,133 

-6,033 

1,859 

10 

54,200 

23,700 

0,022 

*Yt= 166,467 + 19,933X, 


R 2 = 0,8409 


(19,021) (3,066) 


R 2 = 0,8210 


(8,752) (6,502) 


d= 0,716 


*Yi = 222,383- 8,0250X,+ 2,542X,- 2 

R 2 = 0,9284 


(23,488) (9,809) 

(0,869) 

R 2 = 0,9079 


(9,468) (-0,818) 

(2,925) 

d= 1,038 


'£= 141,767 + 63,478*, 

12.962X, 2 + 0,939X7 

R 2 = 0,9983 


(6,375) (4,778) 

(0,9856) (0,0592) 

R 2 = 0,9975 


(22,238) (13,285) 

(-13,151) (15,861) 

d = 2,70 



mos dizer que ha “correla£ao” positiva nos resfduos, pois o valor calculado de d e menor que 
d v . Para a funtjao cubica de custo, a verdadeira especificat^ao, o valor estimado de d, nao indica 
qualquer “correlaijao” positiva nos resfduos. 22 

A “correla£ao” positiva observada nos resfduos quando ajustamos o modelo linear ou quadratico 
nao e uma medida da correlatjao serial (de primeira ordem), mas de erro(s) de especificat^ao (do mo¬ 
delo). A correlat^ao observada reflete o simples fato de que uma ou mais variaveis que pertencem ao 
modelo estao incluidas no termo de erro e precisam ser retiradas e introduzidas como variaveis expla- 
natorias: se excluirmos o X ] da fun£ao de custo, como mostra a Equa£ao (13.2.3), o termo de erro no 
modelo mal especificado (13.2.2) sera, de fato, (u u + ft 4 X )) e exibira um padrao sistematico (por 
exemplo, uma correlatjao positiva) se X] afetar Y significativamente. 

Para usarmos o teste de Durbin-Watson com o objetivo de detectar o(s) erro(s) de especificat^ao 
de modelo, procederemos da seguinte forma: 

1. Do modelo em questao, obtemos os resfduos de mfnimos quadrados ordinarios (MQO). 

2. Se acreditamos que o modelo suposto esteja mal especificado uma vez que exclui uma varia- 
vel explanatoria relevante, por exemplo, Z do modelo, ordenamos os resfduos obtidos no 
Passo 1 de acordo com valores crescentes de Z. Nota : a variavel Z poderia ser uma das varia¬ 
veis X incluidas no modelo assumido, ou poderia ser uma fun 9 ao daquela variavel, como X 2 
oul 3 . 

3. Calculamos a estatfstica d com base nos resfduos assim ordenados, pela formula usual d, a 
saber: 


, _ E"= 2 (“' - “f-1) 2 

“ s-^n * 2 

22 t =i u f 

Nota: o subscrito 1 e o indice da observa 9 ao e nao significa necessariamente que os dados 
sejam relativos a uma serie temporal. 


22 


No contexto, um valor de d = 2 nao significara erro de especificagao. (Por que?) 
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4. Das tabelas de Durbin-Watson, se o valor estimado de d for significativo, entao poderemos 
aceitar a hipotese de ma especificapao do modelo. Se esse for o caso, as medidas corretivas 
ficarao claras. 

Em nosso exemplo de custo, a variavel Z ( = X) (produto) ja foi ordenada. 21 Portanto, nao temos 
de calcular a estatistica d novamente. Como vimos, a estatistica d para as tunodes de custo linear e 
quadratica sugere erros de especificapao. As medidas corretivas estao claras: introduzimos os termos 
cubico e quadratico na funpao de custo linear e o termo cubico na funpao de custo quadratica. Em 
resumo, estimamos o modelo cubico de custo. 

O teste RESET de Ramsey 

Ramsey propos um teste geral para detectar erros de especificapao chamado RESET (do ingles, 
regression specification error test). 24 Ilustraremos apenas sua versao mais simples. Para fixarmos as 
ideias, continuaremos com nosso exemplo de custo-produpao e vamos supor que a funpao de custo 
seja linear na produpao como 


Yi — X i + XjXi + ujj 


(13.4.6) 


em que Y — custo total eX = produpao. Agora, se representarmos graficamente os residuos ii, obtidos 
dessa regressao contra Y„ o Y, estimado pelo modelo, obteremos o grafico da Figura 13.2. Embora 
^2uj c )T Ui % sejam necessariamente iguais a zero (por que? Veja o Capitulo 3), a figura mostra um 
padrao de mudanpa da media dos residuos com Y t . Isso sugere que, se introduzirmos Y t na Equapao 
(13.4.6), como regressor, ele deve aumentar o R 2 ; e, se o aumento de R 2 for estatisticamente significa¬ 
tivo (com base no teste F discutido no Capitulo 8), esse sugerira que a funpao de custo linear (13.4.6) 
foi mal especificada. Essa e a essentia da ideia do RESET. As etapas na aplicapao do RESET sao: 

1. Do modelo escolhido, isto e, a Equapao (13.4.6), obtemos o Y t estimado, Y t . 

2. Recalculamos a Equapao (13.4.6) introduzindo de algum modo Y t como regressor(es) 
adicional(is). Da Figura 13.2, observamos que ha uma relapao curvilfnea entre u, e Y n suge- 
rindo que podemos introduzir Y 2 e Y ■ como regressores adicionais. Calculamos: 

Yt= P\+ PiXi + P 3 Y 2 + fi 4 Y 2 + Ui (13.4.7) 


3. Seja o R 2 obtido da Equapao (13.4.7) R 2 ovo e aquele obtido da Equapao (13.4.6) R v C iho- Po¬ 
demos usar o teste F introduzido na Equapao (8.4.18), a saber. 


(-^novo _ R ^eiho) /numero de novos regressores 
(1 - R 2 nmo )/(n - numero de parametros no novo modelo) 


(8.4.18) 


para verificar se o aumento em R 2 decorrente da utilizapao da Equapao (13.4.7) e estatistica¬ 
mente significativo. 

4. Se o valor calculado de F for significativo, por exemplo, a 5%, podemos aceitar a hipotese 
de que a especificapao do modelo (13.4.6) estava errada. 

Voltando ao nosso exemplo, temos os seguintes resultados (erros padrao entre parenteses): 

^ = 166,467 + 19,933a, (13.4.8) 

(19,021) (3,066) R 2 = 0,8409 


23 Nao importa se ordenamos a ii, de acordo com Xf ou X 3 , uma vez que sao funpoes de x„ que ja e ordenada. 

24 RAMSEY, J. B. "Tests for specification errors in classical linear least squares regression analysis." lournal of the 
Royal Statistical Society, serie B, v. 31, p. 350-371,1969. 
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FIGURA 13.2 

Resfduos Uj e Y 
estimado da fungao 
linear de custo: Y t = 
A ] + 7-2 Xj + Uj. 
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Yj = 2140,7223 + 476,6557A, - 0,09187y, 2 + 0,000119^ 

(132,0044) (33,3951) (0,00620) (0,0000074) (13.4.9) 

R 1 = 0,9983 

Nota : Y] e K - na Equagao (13.4.9) sao obtidos da Equagao (13.4.8). 

Agora, aplicando o teste F, encontramos 

(0,9983 - 0,8409)/2 

~ (1 - 0,9983)/(10 - 4) (13.4.10) 

= 284,4035 

O leitor pode verificar facilmente que o valor dc F e altamente significativo, indicando que o 
modelo (13.4.8) esta mal especificado. Evidentemente, chegamos a mesma conclusao com base no 
exame visual dos residuos, bem como no valor d de Durbin-Watson. Deve-se acrescentar que, uma 
vez estimado Y b esta e uma variavel aleatoria e, portanto, os testes habituais de significancia 
aplicam-se, se a amostra for razoavelmente grande. 

Uma vantagem do RESET e sua facilidade de aplicagao, pois nao exige que se especifique qual e 
o modelo alternativo. Mas essa tambem e uma desvantagem, porque saber que um modelo e mal es¬ 
pecificado nao nos ajuda necessariamente na escolha de uma alternativa melhor. 

Como ressalta um autor: 

Na pratica, o teste RESET pode nao ser muito eficiente para detectar qualquer alternativa especlfica a 
um modelo proposto e sua utilidade reside em servir como indicador geral de que ha algo de errado. Por 
essa razao, um teste como o RESET as vezes e descrito como um recurso para identificar uma falha na 
especificagao, em oposigao a um teste de especificagao. Essa distingao e bastante sutil, mas a ideia ba- 
sica e que um teste de especificagao examina detemiinado aspecto de uma equagao, tendo em mente a 
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hipotese nula e alternativa. Um teste de erro de especificagao, por outro lado, pode detectar varias alter- 
nativas e indica que ha algo de errado sob a hipotese nula, sem dar necessariamente clara orientagao 
quanto a hipotese alternativa que sera adequada. 25 

O teste do multiplicador de Lagrange (ML) para acrescimo de variaveis 

Esta e uma alternativa ao teste RESET de Ramsey. Para ilustrar esse teste, continuaremos com o 
exemplo anterior. Se comparamos a fungao linear de custo (13.4.6) com a cubica (13.4.4), veremos 
que a primeira e uma versao restrita da segunda (lembre-se do exame dos mmimos quadrados res- 
tritos no Capitulo 8). A regressao restrita (13.4.6) pressupoe que os coeficientes dos termos quadra- 
tico e cubico sao iguais a zero. Para testar isso, o ML segue as seguintes etapas: 

1. Estima-se a regresao restrita (13.4.6) pelo MQO e obtem-se os resfduos, u r 

2. Se, de fato, a regressao nao restrita (13.4.4) for a verdadeira regressao, os residuos obtidos 
em (13.4.6) deverao estar relacionados com os termos quadratico e cubico, isto e, A 2 e X ). 

3. Isto sugere que se faga a regressao dos u t obtidos na etapa 1 contra todos os regressores (in¬ 
clusive aqueles da regressao restrita), o que, neste caso, daria: 

Uj = oq + a 2 X t + a 3 X 2 + a 4 X 2 + v,- (13.4.11) 

em que v e um termo de erro com as propriedades usuais. 

4. Para uma amostra grande, Engle mostrou que n (o tamanho da amostra) vezes o R 2 estimado 
da regressao (auxiliar) (13.4.11) segue uma distribuigao qui-quadrado com um niimero de 
gratis de liberdade igual as restrigoes impostas pela regressao restrita, que no exempo sao 
duas, visto que os termos X 2 e X 2 foram tirados do modelo. 26 Simbolicamente, tem-se 

^ ^ a SS ^(numeros de restripoes) (13.4.12) 

em que asy significa assintoticamente, isto e, em grandes amostras. 

5. Se o valor do qui-quadrado obtido na Equagao (13.4.12) excede o valor critico ao nivel de 
significancia escolhido, rejeita-se a regressao restrita. Caso contrario, ela nao e rejeitada. 

Para o nosso exemplo, os resultados foram: 

% = 166,467+ 19,333A, (13.4.13) 

em que feo custo total elea produgao. Os erros padrao dessa regressao ja foram dados na 
Tabela 13.1. 

Quando fazemos uma regressao dos resfduos da Equagao (13.4.13), como sugerido na 
Etapa 3, obtemos os seguintes resultados: 

Z, =- 24,7 + 43,5443a, - 12,9615Af + 0,9396X 2 

ep= (6,375) (4,779) (0,986) (0,059) (13.4.14) 

R 2 = 0,9896 

Embora o tamanho de nossa amostra de 10 observagoes nao seja grande, so para ilustrar o meca- 
nismo ML, obtemos nR 2 = (10)(0,9896) = 9,896. Da tabela do qui-quadrado observamos que para 2 
gratis de liberdade o valor critico do qui-quadrado a 1% e cerca de 9,21. Portanto, o valor observado 


25 STEWART, Jon; GILL, Len. Econometrics. 2. ed., Europa: Prentice-Hall, 1998. p. 69. 

26 ENGLE, R. F. "A general approach to Lagrangian multiplier model diagnostics." journal of Econometrics, 1982. 
v. 20, p. 83-104. 
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de 9,896 e significative) ao nivel de 1% e nossa conclusao seria rejeitar a regressao restrita (a fungao 
linear de custo). Chegamos a uma conclusao parecida com base no teste RESET de Ramsey. 


13.5 Erros de medida 

Supusemos implicitamente que a variavel dependente Y e as variaveis explanatorias, os X, sao 
medidas sem erro. Logo, na regressao de despesas de consumo sobre renda e riqueza das famtlias, 
pressupomos que os dados relativos a essas variaveis sejam “exatos”; nao sao estimativas (conjetu- 
ras) extrapoladas, interpoladas ou arredondadas de modo sistematico, como ate a casa das centenas 
de dolares e assim por diante. Infelizmente, esse ideal nao e alcancado na pratica por diversas razoes, 
como erros por falta de respostas, erros de transcrigao e de calculo. Quaisquer que sejam as razoes, o 
erro de medigao pode ser um problema complicado, pois constitui outro exemplo de vies de especifi- 
cagao cujas consequencias sao mencionadas a seguir. 

Erros de medida da variavel dependente Y 

Considere o seguinte modelo: 

Y.=a+pX,+ u, (13.5.1) 

em que Y* — despesas permanentes de consumo 27 
Xj = renda corrente 
iij — termo de erro estocastico 

Como nao podemos medir Y* diretamente, podemos usar uma variavel de despesas observavel Y t 
tal que 

r, = K + (13.5.2) 

em que e, denota erros de medida em Y*. Portanto, em vez de calcularmos a Equagao (13.5.1), esti- 
mamos 


Yj — (a + /l Xi + ii + £i 

= a + PX, + (u, + £,) (13.5.3) 

- a + fiXj + v, 


em que v ; = m, + e, e um termo composto de erro, contendo o termo de erro da popula 5 ao (que pode 
ser chamado de termo de erro da equagao) e o termo de erro de medida. 

Suponha simplesmente que £’(«,) = L’(e,) = 0, cov (X r u,) — 0 (que e uma hipotese da regressao 
linear classica) e cov (X„ s ,) = 0; isto e, os erros de medida em Y* nao estao correlacionados com X h 
e cov (X n e,) = 0; isto e, o erro da equagao e o erro de medida nao estao correlacionados. Com essas 
hipoteses, podemos ver que o (i estimado da Equagao (13.5.1) ou da Equagao (13.5.3) sera um esti- 
mador nao tendencioso do verdadeiro f J > (veja o Exercicio 13.7); os erros de medida da variavel de¬ 
pendente Y nao destroem a propriedade de ausencia de vies dos estimadores de MQO. No entanto, as 
variancias e os erros padrao de /I calculados por meio das Equagoes (13.5.1) e (13.5.3) serao diferen- 
tes, porque, ao empregarmos as formulas habituais (veja o Capftulo 3), obteremos 


Modelo (13.5.1): 


var(/3) = 



(13.5.4) 


27 


Esta frase deve-se a Milton Friedman. Veja tambem o Exercicio 13.8. 





482 


Parte Do is Relaxamento das hipoteses do modelo classic o 


Modelo (13.5.3): 


var(^) 


_2 


at + at 


H- 


(13.5.5) 


Obviamente, a segunda variancia e maior que a primeira. 28 Embora os erros de medida na varia- 
vel dependente ainda deem estimativas nao tendenciosas dos parametros e suas variancias, as 
variancias estimadas agora sao maiores que no caso cm que nao ha tais erros de medida. 


Erros de medida na variavel explanatoria X 

Agora suponha que, no lugar da Equarjao (13.5.1), tenhamos o seguinte modelo: 

Yj = a + pX* + m (13.5.6) 


em que Y t = despesas atuais de consumo 
X* — renda permanente 

= termo de erro (da equa£ao) 

Suponha que, em vez de observarmos X * observamos 

x > = x *i + w i (13.5.7) 

em que w, representa erros de medida em X* Portanto, em vez de calcularmos a Equa£ao (13.5.6), 
estimamos 


Y = a + fi(Xi - Wj) + u, 

= a + fix, + {m - p Wi ) (13.5.8) 

= Q! + fiXj + Zi 

em que z, = m, — ftw h um composto de erros da equa 9 ao e de medida. 

Agora, mesmo que suponhamos que w, tenha media zero, seja serialmente independente e nao 
esteja correlacionado a m„ nao podemos mais supor que o termo de erro z.j seja independente da 
variavel explanatoria X h porque (supondo E[z,\ = 0) 

cov(z i , Xi) = E[z t - £(z,)][X, - E{Xi)\ 

= E{ui — /3wi)(wj) usando (13.5.7) 

= E(-pwf) (13.5.9) 

= - 


Assim, a variavel explanatoria e o termo de erro na Equa^ao (13.5.8) estao correlacionados, o 
que viola a hipotese crucial do modelo classico de regressao linear de que a variavel explanatoria 
nao esta correlacionada com o termo de erro estocastico. Se essa hipotese nao for respeitada, pode-se 
mostrar que os estimadores de MQO nao so sao tendenciosos, mas tambem inconsistentes; eles 
continuam tendenciosos mesmo que o tamanho da amostra n aumente indefinidamente . 29 


28 Mas note que essa variancia ainda e nao tendenciosa, porque sob as condigoes estabelecidas o termo de erro 
composto v, = ui + Bj satisfaz as hipoteses basicas do metodo de mfnimos quadrados. 

29 Como mostra o Apendice A, /§ e um estimador consistente de p se, quando n aumenta indefinidamente, a 
distribuifao amostral de p acaba convergindo para o verdadeiro p. Tecnicamente, isso e representado por plim 
n^ooP = P■ Como notado no Apendice A, a consistency e uma propriedade em grande escala e usada com 
frequencia para estudar um estimador quando suas propriedades finitas, ou de amostras pequenas (nao ten- 
denciosidade) nao puderem ser determinadas. 
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EXEMPLO 13.2 


No caso do modelo (13.5.8), demonstra-se na Seqao 13A do Apendice 13Aque 


plim/3 = p 


(13.5.10) 


, 1+ a ll a r. 

em que a 2 w e a 2 x * sao as variancias de w, e X*, respectivamente, e piim f> indica o limite da probabili- 


dade de , 


Comoesperamos que o termo entreparenteses sejamenor que 1 (por que?), aEqua£ao (13.5.10) 
mostra que, mesmo que o tamanho da amostra aumente indefinidamente, ft nao convergira para f J >. 
De fato, se consideramos ft positivo, /3 subestimara ft, isto e, e viesado em torno de zero. Eviden- 
temente, se nao houver erros de medida em X (por exemplo, cr 2 w = 0), /3 fornecera um estimador 
consistente de ft. 


Os erros de mcdigao impoem um serio problema quando estao presentes nas variaveis explana- 
torias, porque tomam impossrvel a estimagao de parametros consistentes. Evidentemente, como vi- 
mos, se eles estiverem apenas na variavel dependente, os estimadores permanecerao nao tendenciosos 
e, portanto, consistentes. Se houver erros de medida na(s) variavel(is) explanatoria(s), qual sera a 
soluqao? Nao e facil responder. No extremo, podemos supor que, se a 2 , for pequeno comparado a 
o\*, para todos os fins praticos podemos “ignorar” o problema e proceder a estimaqao usual com 
MQO. Obviamente, a questao aqui e que nao podemos observar ou medir o 2 v c (i 2 P e nao ha como 
avaliar suas magnitudes relativas. 

Outra corre§ao sugerida e o uso de variaveis instrumentais ou proxy que, embora estejam alta- 
mente correlacionadas com as variaveis originais X, nao estao correlacionadas com os termos de erro 
da equa£ao e de medida (m,- e vv,). Se for possivel encontrar essas variaveis proxy, obteremos uma 
estimativa consistente de ft. Mas e muito mais facil falar do que fazer isso. Na pratica nao e facil 
encontrar boas proxies', com frequencia estamos em situa§ao de reclamar do mau tempo sem sermos 
capazes de fazer muito para muda-lo. Alem disso, nao e facil verificar se a variavel instrumental se- 
lecionada e, de fato, independente dos termos de erro m, e w,. 

Na literatura especifica ha outras sugestoes para resolver o problema. 30 Mas a maioria delas e especl- 
fica a determinada situagao e baseia-se em hipoteses restritivas. Nao ha resposta satisfatoria ao problema 
de erros de medida. E por isso que e tao importante medir os dados com a maxima exatidao possivel. 


Conclufmos esta se^ao com um exemplo elaborado para destacar os aspectos aborda- 
dos. A Tabela 13.2 apresenta dados hipoteticos sobre as verdadeiras despesas de consumo 
Y*, a verdadeira renda X*, o consumo medido lea renda medida X. A tabela tambem 
explica como essas variaveis foram medidas 31 . 

Erros de medida apenas na variavel dependente Y. Com base nos dados apresen- 
tados, a verdadeira fun^ao de consumo e 

Y*= 25,00 + 0,6000X* 


(10,477) 
t= (2,3861) 


(0,0584) 

(10,276) 

R 2 = 0,9296 


( 13 . 5 . 11 ) 

( Continua ) 


30 Veja FOMBY, Thomas B.; HILL, R. Carter; JOHNSON, Stanley R. Advanced econometric methods. Nova York: 
Springer-Verlag, 1984. p. 273-277. Veja tambem KENNEDY, op. cit., p. 138-140, para uma discussao de re- 
gressao ponderada e tambem de variaveis instrumentais. Veja ainda: MADDALA, G. S. Introduction to econome¬ 
trics. 3. ed. Nova York: John Wiley & Sons, 2001, p. 437^162; e PARIS, Quirino. "Robust estimators of 
errors-in-ariables models: part I." Working Paper N. 04-007, 200, Department of Agricultural and Resource 
Economics, University of California at Davis, ago. 2004. 

31 Estou debito com Kenneth J. White pela construgao deste exemplo. Veja seu Computer Handbook Using SHAZAM, 
para ser utilizado com Damodar Gujarati, Basic Econometrics, September 1985, pp. 11-121. 
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TABELA 13.2 

Dados hipoteticos de 
Y* (verdadeiras 
despesas de 
consumo), de X* 
(verdadeira renda), de 
Y (consumo medido) 
e de X (renda 
medida); todos os 
dados em dolar 

Nota : pressupomos que os 
dados relativos X* sejam 
apresentados. Ao 
derivarmos as outras 
variaveis, foram feitos os 
seguintes pressupostos: (1) 
E(ui) = E(Sj) = E(Wj) = 0; 
(2) cov (X, u ) = cov ( X , s ) 

= cov ( u, s) = cov (w, u) — 
cov (e, w ) = 0; (3) cr 2 = 100, 
<r 2 = 36, e o -2 = 36; e 
(4) Y*= 25 + 0,6X,*+ Uj, 
Y i =Y* + e i eX i =X*+w i . 


Y* 

X* 

Y 

X 

E 

w 

u 

75,4666 

80,00 

67,6011 

80,0940 

-7,8655 

0,0940 

2,4666 

74,9801 

100,00 

75,4438 

91,5721 

0,4636 

- 8,4279 

-10,0199 

102,8242 

120,00 

109,6956 

112,1406 

6,8714 

2,1406 

5,8242 

125,7651 

140,00 

129,4159 

145,5969 

3,6509 

5,5969 

16,7651 

106,5035 

160,00 

104,2388 

168,5579 

-2,2647 

8,5579 

-14,4965 

131,4318 

180,00 

125,8319 

171,4793 

-5,5999 

-8,5207 

-1,5682 

149,3693 

200,00 

153,9926 

203,5366 

4,6233 

3,5366 

4,3693 

143,8628 

220,00 

152,9208 

222,8533 

9,0579 

2,8533 

-13,1372 

177,5218 

240,00 

176,3344 

232,98 79 

-1,1874 

-7,0120 

8,5218 

182,2748 

260,00 

1 74,5252 

261,1813 

-7,7496 

1,1813 

1,2748 


enquanto, se usamos V) em lugar de Y*, obtemos 

Y, = 25,00 + 0,6000X* 

(12,218) (0,0681) 

t= (2,0461) (8,8118) ( 13 . 5 . 12 ) 

R 2 = 0,9066 


Como mostram esses resultados, e de acordo com a teoria, os coeficientes estimados con- 
tinuam os mesmos. O unico efeito dos erros de medida na variavel dependente e que os 
erros padrao estimados dos coeficientes tendem a ser maiores (veja a Equafao (1 3.5.5), o 
que a Equa^ao (1 3.5.12) mostra claramente. A proposito, note que os coeficientes de re- 
gressao nas Equagoes (1 3.5.11) e (1 3.5.12) sao os mesmos, porque a amostra foi gerada 
para ajustar-se as hipoteses do modelo de erros de medida. 

Erros de medida em X. Sabemos que a verdadeira regressao e a Equafao (1 3.5.11). Su- 
ponha agora que, em vez de usarmos X;, usamos X,. (Nota: na realidade X; raramente e 
observavel.) Os resultados da regressao sao: 


Y*= 25,992 

+ 0,5942X, 


(11,0810) 

(0,061 7) 


t = (2,3457) 

(9,6270) 

( 13 . 5 . 13 ) 


R 2 = 0,9205 



Esses resultados estao de acordo com a teoria — quando ha erros de medifao na(s) 
variavel(is) explanatoria(s), os coeficientes estimados sao tendenciosos. Felizmente, neste 
exemplo o vies e bem pequeno — da Equagao (1 3.5.10) e evidente que o vies depende de 
o 2 Jo\* e ao gerar os dados considerou-se que a 2 w = 36 e = 3667, o que tornou o fator 
de vies bastante pequeno, cerca de 0,98% (= 36/3667). 

Cabe ao leitor verificar o que acontece quando ha erros de medigao tanto em Y 
quanto em X, isto e, se fizermos a regressao de V) contra X, em vez de Y ]contra X*(veja 
o Exercfcio 1 3.23). 
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13.6 Especificagao incorreta do terrno de erro estocastico 

Um problema comum que um pesquisador enfrenta e a cspccificagao do termo de erro m, que entra 
no modelo de regressao. Uma vez que o termo de erro nao e diretamente observavel, nao ha maneira 
de determinar com facilidade a forma como ele entra no modelo. Para tanto, vamos retornar aos mo- 
delos apresentados nas Equagoes (13.2.8) e (13.2.9). 

Para tornar a exposigao mais simples, consideramos que nao ha intercepto no modelo. Supomos, 
ainda, que u, na Equagao (13.2.8) e tal que u, satisfaz as hipoteses usuais dos MQO. 

Se considerarmos que a Equagao (13.2.8) e o modelo “correto”, mas estimarmos a Equagao 
(13.2.9), quais serao as consequencias? Na Segao 13A.4 do Apendice 13.A, demonstramos que, se 
In Uj ~ N(0, a 1 ), entao: 

Ui ~ lognormal [e* 7 ^ 2 , e a "(e a " - l)] /-]3 g -|\ 


Como resultado, 

E(a) = /3e al/2 


(13.6.2) 


em que e e a base do logaritmo natural. 

Como se ve, a e um estimador tendencioso, pois seu valor medio nao e igual ao verdadeiro ft. 
Teremos mais a dizer sobre a especificagao do termo de erro estocastico no capitulo sobre modelos 
de regressao nao lineares nos parametros. 


13.7 Modelos aninhados ( nested ) versus nao anintiados ( non-nested ) 

Ao efetuarmos os testes de especificagao, convem distinguir entre modelos aninhados ( nested ) e 
nao aninhados (non-nested). Para tanto, considere os modelos a seguir: 

Modelo A: }, = p | + ^ 2 ^ 2 / d.s+ ft 4 X + P 5 X 5 i + 11 1 

Modelo B; Y L = P\ + P 2 Xy. + + 11 .. 

Dizemos que o Modelo B esta aninhado no Modelo A, porque e um caso especial do Modelo A: 
se estimarmos o Modelo A e testarmos a hipotese de que p 4 = p 5 = 0 e nao a rejeitarmos com base, 
por exemplo, no teste F , 32 o Modelo A se reduzira ao Modelo B. Se acrescentarmos a variavel X 4 ao 
Modelo B, o Modelo A sera reduzido ao Modelo B se p 5 for zero; aqui usaremos o teste t para verifi- 
car a hipotese de que o coeficiente de X 5 e zero. 

Embora nao tivessemos dado essa denominac^ao, os testes de erro de especificagao que discutimos 
no Capitulo 8 sao, essencialmente, testes de hipoteses aninhadas. 

Agora considere os modelos a seguir: 

Modelo C: = ctq + ex 2 X 21 + cx^X^i + u, 

Modelo D: Yj — P \ + P 2 Xi l + Py + v, 

em que os X e os Z sao variaveis diferentes. Esses modelos sao denominados nao aninhados, porque 
nao podemos definir um deles como um caso especial do outro. Dizemos que os Modelos C e D nao 
sao aninhados, porque um nao pode derivar como um caso especial do outro. Em economia, como em 
outras ciencias, mais de uma teoria pode concorrer para a explicagao de um fenomeno. Os monetaristas 


32 Em termos gerais, pode-se usar o teste de razao probabilfstica, ou o teste de Wald oil o teste do multiplicador 
de Lagrange, que discutimos brevemente no Capftulo 8. 
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dao destaque a moeda como explicaqao das varia 5 oes no PNB, enquanto os keynesianos atribuem-nas 
aos gastos do governo. 

Pode-se ressaltar aqui que e posslvel que os Modelos C e D contenham regressores em comum. 
Por exemplo, X 3 poderia ser inclufdo no Modelo D e Z 2 poderia ser inclufdo no Modelo C. Mesmo 
assim, esses sao modelos nao aninhados, porque o C nao contem Z 3 e o D nao contem X 2 . 

Ainda que as mesmas variaveis entrem no modelo, a forma funcional pode tornar os dois modelos 
nao aninhados. Por exemplo, considere o modelo: 

Modelo E: Yf = f\ + @2 In + f 3 In Z 3/ + w t 

Os Modelos D e E nao sao aninhados, pois um nao pode derivar como caso especial do outro. 

Como ja examinamos os testes para os modelos aninhados (os testes t e F), na se?ao a seguir 
discutiremos alguns dos testes de modelos nao aninhados, que antes chamamos de erros de especifi- 
ca£ao do modelo. 


13.8 Testes de hipoteses nao aninhados ( non-nested ) 

De acordo com Harvey , 33 ha duas formas de testar as hipoteses nao aninhadas: (1) a abordagem 
discriminatoria, na qual dados dois ou mais modelos concorrentes, escolhe-se um modelo com base 
em alguns criterios de qualidade do ajustamento e ( 2 ) a abordagem discernente (terminologia nos- 
sa) em que, ao investigarmos um modelo, levamos em conta informa 5 oes fornecidas por outros mo¬ 
delos. Consideraremos essas abordagens rapidamente. 

A abordagem discriminatoria 

Vamos considerar os Modelos C e D da Seqao 13.7. Uma vez que ambos envolvem a mesma va- 
riavel dependente, podemos escolher entre dois (ou mais) modelos com base no criterio da qualidade 
do ajustamento, como o R 2 ou o R 2 ajustado, que ja discutimos. Mas lembre-se de que, ao comparar- 
mos dois ou mais modelos, o regressando deve ser o mesmo. Alem desses criterios, ha outros que 
tambem sao usados. Incluem o criterio de informa^ao de Akaike (CIA, do ingles AIC - Akaike’s 
information criterion), o de Schwarz (CIS, do ingles SIC - Schwarz’s information criterion ou BIC - 
Bayesian information criterion ) e o criterio C p de Mallow, que serao examinados na Secjao 13.9. A 
maioria dos programas estatfsticos modemos ja traz embutidos em suas rotinas de regressao um ou 
mais desses criterios. Na ultima seqao deste capitulo, ilustraremos os criterios usando um exemplo 
extenso. Com base em um ou mais deles, poderemos selecionar um modelo que apresente o R 1 mais 
alto ou o menor valor de CIA ou de CIS etc. 

A abordagem discernente 

O teste F nao aninhado ou o teste F abrangente 

Considere os Modelos C e D introduzidos na Setjao 13.7. Como escolhemos entre os dois mode¬ 
los? Com essa finalidade, estimemos o seguinte modelo aninhado ou hibrido : 

Modelo F: I) = / + X 2 X 2 i + A. 4 Z 2 / + X$Z 2 j + Uj 

Observe que o Modelo F aninha ou abrange os Modelos C e D, mas o Modelo C nao esta aninha¬ 
do em D, e D nao esta aninhado em C, de modo que eles sao modelos nao aninhados. Agora, se o 
Modelo C estiver correto, ), 4 = 7.5 = 0, enquanto, se o Modelo D for correto, teremos \ 2 = X 3 = 0. 
Esse teste pode ser feito por meio do teste usual F, daf o nome teste F nao aninhado. 

No entanto, esse procedimento de teste apresenta problemas. Primeiro, se os X e os Z estiverem 
altamente correlacionados, como observado no capitulo sobre multicolinearidade, e bem provavel 


33 


HARVEY, Andrew. The econometric analysis of time series. 2. ed. Cambridge, Mass.: The MIT Press, 1990. cap. 5. 
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que um ou mais dos k sejam pouco significativos individualmente, do ponto de vista estatistico, em- 
bora, com base no teste F, seja possivel rejeitar a hipotese de que todos os coeficientes angulares sao 
simultaneamente iguais a zero. Nesse caso, nao temos como decidir se o modelo correto e C ou D. 
Em segundo lugar. ha outro problema. Suponha que escolhemos o Modelo C como a hipotese ou 
modelo de referenda, e constatamos que todos os seus coeficientes sao significativos. Agora acres- 
centamos Z 2 ou Z 3 ou ambos ao modelo e verificamos, usando o teste F, que sua contribu^ao margi¬ 
nal a soma dos quadrados explicados pela regressao (SQE) e estatisticamente insignificante. Portanto, 
decidimos escolher o Modelo C. 

Mas imagine que tivessemos escolhido o Modelo D como referenda e descobrimos que todos os 
seus coeficientes eram estatisticamente significativos. Quando acrescentamos X 2 ou X 3 ou ambos a 
esse modelo, verificamos, novamente usando o teste F, que sua contribuifao incremental a SQE e 
insignificante. Portanto, teriamos escolhido o Modelo C como o correto. Dai, “a escolha da hipotese 
de referenda podera determinar o resultado da escolha do modelo”, 34 principalmente se houver gran¬ 
de multicolinearidade nos regressores concorrentes. For fim, o Modelo F aninhado artificialmente 
pode nao ter grande significado economico. 


EXEMPLO 13.3 

Um exemplo 
ilustrativo: o 
modelo de St. 
Louis 


Para determinar se as variag:6es no PNB nominal podem ser explicadas pelas variagoes na 
oferta de moeda (monetarismo) ou por alterafoes nos gastos do governo (keynesianismo), 
consideraremos os modelos: 

V) — a + fio Mt + Mt- 1 + /J 2 /Vfi-2 + Mt~ 3 + ^4 /Vfi-4 + iq t 
4 

— a r ^ f M t -i + iq 1 ( 13 . 8 . 1 ) 

1=0 

Yt = y + Xo E t + A-i f i-i + f t_2+ A 3 f t-3 + A4 f(-4 + u 2 t 
4 

- Y + Et-i + u 2 t ( 13 . 8 . 2 ) 

/= 0 


em que Y t = taxa de crescimento do PNB nominal no perfodo t 

M t = taxa de crescimento da oferta de moeda (versao MQ no perfodo t 
E t = taxa de crescimento dos gastos do governo em termos de pleno emprego 
no perfodo t 


Note que as Equates (1 3.8.1) e (1 3.8.2) sao exemplos de modelos com defasagens dis- 
tribufdas, assunto que sera discutido profundamente no Capftulo 1 7. Por enquanto, obser¬ 
ve que o efeito de uma unidade de varia^ao na oferta de moeda ou nos gastos do governo 
sobre o PNB distribui-se em um perfodo de tempo e nao e instantaneo. 

Uma vez que pode ser diffcil decidir, a priori, entre os dois modelos concorrentes, combi- 
naremos os dois modelos como mostrado a seguir: 

4 4 

Y t = constante + ^ f -' + U3t (13.8.3) 

/= o /= o 

Esse modelo aninhado e uma das formas como o famoso modelo de St. Louis (Federal 
Reserv Bank de St. Louis), um banco que segue a escola monetarista, foi estimado. Os re- 
sultados desse modelo para o perfodo que vai do primeiro trimestre de 1953 ate o quarto 
trimestre de 1976, para os Estados Unidos, sao os seguintes (razoes f entre parenteses): 35 

( Continua ) 


34 FOMBY, Thomas B.; HILL, R. Carter; JOHNSON, Stanley R. Advanced econometric methods. Nova York: Springer 
Verlag, 1984. p. 416. 

35 Veja CARLSON, Keith M. "Does the St. Louis equation now believe in fiscal policy?" Review, Federal Reserve Bank 
of St. Louis, fev. 1978. v. 60, n. 2, p. 1 7, tabela IV. 
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EXEMPLO 13.3 

Coeficiente 

Estimativa 

Coeficiente 

Estimativa 


( Continuagao ) 

A) 

0,40 

(2,96) 

T-o 

0,08 

(2,26) 



A 

0,41 

(5,26) 

X-\ 

0,06 

(2,52) 



h 

0,25 

(2,14) 

Xi 

0,00 

(0,02) 



Pi 

0,06 

(0,71) 

^3 

-0,06 

(- 2,20) 

(13.8.4) 


Pa 

-0,05 

(-0,37) 


-0,07 

(-1,83) 



HPi 

1,06 

(5,59) 

E*' 

0,03 

(0,40) 



i= 0 



/= o 





R 2 = 0,40 
d= 1,78 


O que esses resultados sugerem sobre a superioridade de um modelo sobre o ou- 
tro? Se considerarmos o efeito cumulativo de uma unidade de varia^ao em Me Esobre 
Y, obtemos, respectivamente, Y$=o Pi = 1 06 e Y^=o ' Al = 0-03, sendo que o primeiro e esta- 
tisticamente significativo e o segundo nao. Essa compara^ao tenderia a apoiar a afirma^ao 
monetarista de que sao as variagoes na oferta de moeda que determinam as variagoes no 
PNB (nominal). O leitor podera fazer uma avaliafao crftica dessa afirma^ao como exerefeio. 


Teste J de Davidson-MacKinnon 36 

Devido aos problemas citados no procedimento de teste F nao aninhado, tem sido sugeridas algu- 
mas alternativas. Uma delas e o teste J de Davidson-Mackinnon. Para ilustrar o teste, suponha que 
desejamos comparar a hipotese ou Modelo C com a hipotese ou Modelo D. O teste J e feito como 
segue: 

1. Estimamos o Modelo D e dele obtemos os valores Y estimados, Yf 

2. Acrescentamos o valor previsto na Etapa 1 como um regressor adicional ao Modelo C e es¬ 
timamos o seguinte modelo: 

Yi - a i + a 2 X 2i + a 3 X 3l + a 4 YP + u, (13.8.5) 

em que os valores de Yf sao obtidos da Etapa 1. Este modelo e um exemplo do principio 
abrangente, como no metodo de Hendry. 

3. Usando o teste t, teste a hipotese de que a 4 = 0. 

4. Se a hipotese de que a 4 = 0 nao for rejeitada, poderemos aceitar (isto e, nao rejeitar) o Mo¬ 
delo C como sendo o verdadeiro modelo, porque o Yf inclui'do na Equayao (13.8.5), que 
representa a influencia das variaveis nao incluidas no Modelo C, nao tem poder explanativo 
alem daquele ja fomecido pelo Modelo C. Em outras palavras, o Modelo C abrange o Mo¬ 
delo D no sentido de que este ultimo nao content nenhuma informa 5 ao adicional que possa 
aprimorar o desempenho do Modelo C. Da mesma forma, se a hipotese nula for rejeitada, o 
Modelo C nao podera ser o modelo verdadeiro (por que?) 

5. Agora, revertemos os papeis das hipoteses, ou os Modelos C e D. Estimamos C, usamos os 
valores de Y estimados por esse modelo como o regressor na Equa 9 ao (13.8.5), repetimos a 
Etapa 4 e decidimos se aceitamos o Modelo D em vez do C. Mais especificamente, estima¬ 
mos o seguinte modelo: 

Yi = ft i + p 2 Z 2i + p 3 Z 3i + p 4 Yf + Ui (13.8.6) 


36 DAVIDSON, R.; J. C. MACKINNON, R. "Several tests for model specification in the presence of alternative 
hypotheses." Econometrica, 1981. v. 49, p. 781-793. 
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em que Yf sao os valores estimados do Modelo C. Agora testamos a hipotese de que /J 4 = 0. 
Se essa hipotese nao for rejeitada, escolhemos o Modelo D em vez de C. Se a hipotese de 
que /3 4 = 0 for rejeitada, escolhemos C em vez de D, ja que o Modelo D nao aprimora o 
desempenho de C. 

Embora intuitivamente isso seja atraente, o teste J tem alguns problemas. Uma vez que os 
testes dados em (13.8.5) e (13.8.6) sao realizados de modo independente, temos os seguintes re- 
sultados provaveis: 


Hipotese: f) 4 = 0 
Nao rejeitar 
Rejeitar 


Hipotese: a 4 = 0 

Nao rejeitar Rejeitar 

Aceitar tanto C quanto D Aceitar D, rejeitar C 

Aceitar C, rejeitar D Rejeitar tanto C quanto D 


Como mostra a tabela, nao conseguiremos obter uma resposta clara se o procedimento do teste J 
levar a aceitapao ou rejeipao de ambos os modelos. No caso de ambos os modelos serem rejeitados, 
nenhum deles nos ajudara a explicar o comportamento de Y. Da mesma forma, se ambos os modelos 
forem aceitos, como observa Kmenta, “os dados aparentemente nao sao ricos o suficiente para dis- 
criminar entre as duas hipoteses [modelos]”. 37 

Outro problema com o teste J e que, quando usamos a estatfstica t para verificar a significance da 
variavel Y estimada pelos modelos (13.8.5) e (13.8.6), a estatfstica t tem a distribu^ao normal padrao 
apenas assintoticamente, isto e, em grandes amostras. Portanto, o teste J pode nao ser muito poderoso 
(no sentido estatfstico) em pequenas amostras, pois tende a rejeitar a hipotese ou o modelo verdadei- 
ro mais frequentemente do que deveria. 


EXEMPLO 13.4 

Despesas de 
consumo pessoal e 
renda pessoal 
disponivel 


Para ilustrar o teste j, considere os dados na Tabela 1 3.3, que apresenta dados sobre 
as despesas de consumo pessoal per capita (DCPC) e a renda pessoal disponfvel per 
capita (RPPC), ambas medidas em dolares (2009); para os Estados Unidos, no perfodo 
de 1970-2005. Considere os seguintes modelos rivais: 

Modelo A: DCPC r = oq + a 2 RPPC r + c^PPC,-.! + U T (1 3.8.7) 


Modelo B: DCPC r = ft + /3 2 RPPC r + /3 3 DCPC r _i + U T (13.8.8) 


O Modelo A estabelece que DCPC depende de RPPC nos periodos atual e anterior, sendo 
um exemplo do que denominamos modelo de defasagens distribuidas (veja o Capftu¬ 
lo 1 7). O Modelo B postula que DCPC depende de RPPC no perfodo atual e de DCPC no 
perfodo anterior, o que o faz representar o que conhecemos como modelo autorregres- 
sivo (veja o Capftulo 1 7). Uma razao para a inclusao do valor defasado de DCPC e que o 
modelo visa refletir a inercia ou persistence dos habitos. 

Os resultados das estimativas separadas desses modelos foram: 

Modelo A: DCPC t = - 606,6347 + 0,61 70 RPPQ + 0,3530 RPPC t _! 

t= (-3,8334) (2,5706) (1,4377) (13.8.9) 

R 2 = 0,9983 d= 0,2161 

Modelo B: DCPC t = 76,8947 + 0,2074 RPPQ + 0,8104 DCPC t -! 
t= (0,7256) (2,6734) (9,7343) 

R 2 = 0,9996 d= 0,9732 


(13.8.10) 

( Continua ) 


37 


KMENTA, Jan. op. cit., p. 597. 
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EXEMPLO IB.4 

( Continuagao ) 


TABELA 13.3 

Ano 

DCPC 

Despesas de 

1970 

3.162 

consumo pessoal per 

1971 

3.379 

capita (DCPC) e 

1972 

3.671 

renda pessoal 

1973 

4.022 

dispomvel per capita 

1974 

4.364 

(RPPC), EUA, 

1975 

4.789 

1970-2005 

1976 

5.282 

Fonte: Economic Report of 

1977 

5.804 

the President, 2007. 

1978 

6.417 


1979 

7.073 


1980 

7.716 


1981 

8.439 


1982 

8.945 


1983 

9.775 


1984 

10.589 


1985 

11.406 


1986 

12.048 


1987 

12.766 


RPPC 

Ano 

DCPC 

RPPC 

3.587 

1988 

13.685 

15.297 

3.860 

1989 

14.546 

16.257 

4.140 

1990 

15.349 

17.131 

4.616 

1991 

15.722 

17.609 

5.010 

1992 

16.485 

18.494 

5.498 

1993 

1 7.204 

18.872 

5.972 

1994 

18.004 

19.555 

6.517 

1995 

18.665 

20.287 

7.224 

1996 

19.490 

21.091 

7.967 

1997 

20.323 

21.940 

8.822 

1998 

21.291 

23.161 

9.765 

1999 

22.491 

23.968 

10.426 

2000 

23.862 

25.472 

11.131 

2001 

24.722 

26.235 

12.319 

2002 

25.501 

27.164 

13.037 

2003 

26.463 

28.039 

13.649 

2004 

27.937 

29.536 

14.241 

2005 

29.468 

30.458 


Se tivessemos de escolher entre esses dois modelos com base na abordagem discri- 
minatoria, usando o criterio R 2 mais elevado, provavelmente escolherfamos o Modelo B 
(13.8.10), ambas as variaveis estatisticamente significativas, enquanto no Modelo A 
(1 3.8.9) somente a RPPC atual e estatisticamente significativa (mas pode haver proble- 
ma de colinearidade). Para fins de previsao, nao ha muita diferen^a entre os dois valores 
R 2 estimados. 

Para aplicar o teste /, suponha que o Modelo A seja a hipotese nula, ou o modelo man- 
tido, e o Modelo B seja a hipotese alternativa. Seguindo as etapas do teste / discutidas, 
usamos os valores DCPC estimados do modelo (1 3.8.10) como um regressor adicional no 
Modelo A. O resultado dessa regressao e o seguinte: 


DCPC t = - 35,1 7 + 0,2762 RPPC t - 0,5141 RPPC,_, + 1,2351 DCPcf 

t= (-0,43) (2,60) (-4,05) (12,06) (13.8.11) 

R 2 = 1,00 d = 1,5205 

em que DCPC t do lado direito da Equafao (1 3.8.11) representa os valores estimados DCPC 
com base no Modelo B original (1 3.8.10). Uma vez que o coeficiente dessa variavel e esta¬ 
tisticamente significativo com um t estatfstico de 12,06, apos o procedimento do teste / 
temos de rejeitar o Modelo A em favor do Modelo B. 

Agora suponhamos que o Modelo B seja a hipotese mantida e o A seja a alternativa. Se¬ 
guindo exatamente o mesmo procedimento, obtemos os seguintes resultados: 


DCPQ = 
f = 


823,7 + 1,4309 RPPC t 
(- 3,45) (4,64) 


+ 1,0009 DCPCt-1 
(12,06) 

R 2 = 1,00 


- 1,4563 DCPcf 

(-4,05) 
d= 1,5205 


(13.8.12) 


( Continua ) 
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EXEMPLO 13.4 em que DCPCf no lado direito da Equag:ao (1 3.8.12) representa os valores estimados do 

('Continuagao ) Modelo A original (1 3.8.9). Nessa regressao, o coeficiente de DCPCf tambem e estatisti- 

camente significativo com um t estatistico de —4,05. Isso sugere que agora deverfamos 
rejeitar o Modelo B em favor do A. 

Tudo isso nos diz que nenhum modelo e extremamente util para explicar o comporta- 
mento da despesa de consumo pessoal per capita nos Estados Unidos durante o perfodo 
1970-2005. Evidentemente, consideramos apenas dois modelos concorrentes; na realida¬ 
de, pode haver mais de dois. O procedimento do teste / pode ser estendido para multiplas 
compara^oes do modelo, embora a analise possa tornar-se complexa rapidamente. 

Este exemplo mostra de maneira clara por que o modelo classico de regressao linear 
pressupoe que o modelo de regressao usado na analise seja corretamente especificado. Ao 
desenvolver um modelo e crucial prestar aten^ao ao fenomeno que esta sendo modelado. 


Outros testes para a selegao de modelos 

O teste J que discutimos e apenas um de um grupo de testes para selegao de modelo. Ha o teste 
Cox, o teste JA e o teste P, o teste abrangente de Mizon-Richard e variantes desses. Evidentemen¬ 
te, nao podemos discutir esses testes especializados, mas o leitor podera consultar as referencias cita- 
das nas v arias notas de rodape. 38 


13.9 Criterios para sele^ao de modelos 

Nesta se§ao discutiremos varios criterios para escolher entre modelos concorrentes e/ou com¬ 
parer modelos para fins de previsao. Aqui vamos dintinguir entre a previsao dentro e fora da 
amostra. A primeira diz basicamente como o modelo escolhido ajusta-se aos dados de determina- 
da amostra. A previsao fora da amostra procure determinar como um modelo ajustado preve os 
valores futures do regressando, dados os valores dos regressores. 

Varios criterios sao usados para esse fim. Discutiremos especialmente estes criterios: (1) R 2 , (2) 
R 2 ajustado ( =R 2 ), (3) criterio de informa 9 ao de Akaike (CIA), (4) criterio de informacjao de Schwarz 
(CIS), (5) criterio C p de Mallows e (6) previsao y 2 (qui-quadrado). Todos visam minimizar a soma 
dos quadrados dos residuos (SQR) (ou aumentar o valor de R 2 ). Entretanto, com exceqiao do primeiro, 
os criterios (2), (3), (4) e (5) impoem um onus por incluir um numero cada vez maior de regressores. 
Assim, ha um trade-off entre a qualidade do ajuste do modelo e sua complexidade (julgada pelo nu¬ 
mero de regressores). 

O criterio R 2 

Sabemos que uma das medidas da qualidade do ajustamento de um modelo de regressao e R 2 , 
definido como: 


r2= SQE = j_ SQR 
SQT SQT 


(13.9.1) 


R 2 situa-se necessariamente entre 0 e 1. Quanto mais proximo de 1, melhor o ajustamento. Mas o R 2 
apresenta problemas. Primeiro, ele mede a qualidade do ajustamento dentro da amostra, no sentido da 
proximidade entre os valores estimados de Y e seu valor observado na amostra dada. Nao ha garantia 
de que fa 5 a uma boa previsao das observa 9 oes fora da amostra. Um segundo problema e que, na 
compara 9 ao de dois ou mais R 2 , a variavel dependente, ou regressando, deve ser a mesma. Terceiro, e 
o mais importante, um R 2 nao pode cair quando mais variaveis sao acrescentadas ao modelo. Portanto, 
sempre existe a tenta 9 ao de “maximizar o R 2 ”, acrescentando mais variaveis ao modelo. Adicionar mais 
variaveis ao modelo pode aumentar R 2 , mas tambem pode aumentar a variancia do erro de previsao. 


38 Veja tambem BALTAGI, Badi H. Econometrics. Nova York: Springer, 1998. p. 209-222. 





492 


Parte Do is Relaxamento das hipoteses do modelo classic o 


R 2 ajustado 

Como medida corretiva para compensar o efeito de adigao de regressores que aumentam o valor 
de R 2 , Henry Theil desenvolveu o R 2 ajustado, denotado por R 2 . que estudamos no Capftulo 7. Lem- 
bre-se de que 


R2= SQR/(« - k) 
SQT/(« - 1) 


1 - (1 


R 2 ) 


n — 1 
n - k 


(13.9.2) 


Como podemos ver dessa formula, R 2 < R 2 mostra como o R 2 ajustado corrige o acrescimo de 
regressores. Como notamos no Capftulo 8, ao contrario do R 2 , o R 2 ajustado aumentara apenas se o 
valor t absoluto da variavel adicionada for maior que 1. Portanto, para fins de comparagao, R 2 e uma 
medida melhor que R 2 . Mas novamente, lembre-se de que o regressando deve ser o mesmo para que 
a comparagao seja valida. 


Criterio de informa^ao de Akaike (CIA) 

A ideia de impor uma medida corretiva pelo acrescimo de regressores ao modelo foi levada adian- 
te no criterio CIA, definido como: 


CIA = 



n 



(13.9.3) 


em que ke o numero de regressores (incluindo o intercepto) eneo numero de observagoes. Por con- 
veniencia matematica, a Equagao (13.9.3) e escrita como 


In CIA = 



(13.9.4) 


em que In CIA = logaritmo natural de CIA e 2 kin = fator de corregao. Alguns textos e programas 
definem CIA apenas em termos de sua transformagao logaritmica, de modo que nao ha necessidade de 
colocar In antes de CIA. Como se ve na formula, o criterio de informagao de Akaike impoe uma me¬ 
dida corretiva mais dura que R 2 pelo acrescimo de regressores. Ao compararmos dois ou mais mode- 
los, o modelo com o valor mais baixo de CIA e preferido. Uma vantagem do CIA e que e util nao so 
dentro da amostra, mas tambem fora dela, prevendo o desempenho de um modelo de regressao. Tam- 
bem, e util tanto para modelos aninhados quanto nao aninhados. Ele tambem tem sido usado para de- 
terminar a extensao da defasagem em um modelo AR(/;). 

Criterio de informagao de Schwarz (CIS) 

Semelhante ao CIA, o criterio CIS e definido como: 


Yu 2 ,, SQR 
CIS = n kjnL ^ = n k ! n ——- 


ou na forma logaritmica: 


/SQR\ 


In CIS = - In « + In —— ) 
n \ n ) 


(13.9.5) 


(13.9.6) 
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em que [(k/n) In 11 \ e o fator de corre?ao. O CIS impoe medidas corretivas mais duras que o CIA, como 
fica evidente ao comparar a Equafao (13.9.6) com a (13.9.4). Como o CIA, quanto mais baixo o valor 
do CIS, melhor o modelo. Novamente, como o CIA, o CIS pode ser usado para comparar o desem- 
penho do modelo quando as previsoes sao feitas dentro e fora da amostra. 

O criterio C p de Mallows 

Supondo um modelo consistindo em k regressores, inclusive o intercepto. Seja rr como de costu¬ 
me, o estimador do verdadeiro cr. Mas suponha que so escolhamos p regressores (p < k) e obtemos 
a SQR da regressao usando esses p regressores. Seja SQR p a soma dos quadrados dos resfduos com 
os p regressores. Agora C. R Mallows desenvolveu o seguinte criterio para sele£ao de modelos, co- 
nhecido como criterio C p . 




- (n- 2p) 


(13.9.7) 


em que neo numero de observa£6es. 

Sabemos que E ( cr ) e um estimador nao tendencioso do verdadeiro cr. Se o modelo com p regres¬ 
sores for adequado na medida em que nao sofre da falta de ajustamento, pode-se demonstrar 39 que 
E(SQR p ) — (n — p)cr. Em consequencia, e quase certo que 

E(C P ) - (n ~ P 2 )a ~ - (n - 2p) = p (13.9.8) 

cr 2 

Ao selecionarmos um modelo de acordo com o criterio C p , procuramos um que tenha um valor 
baixo de C p , quase igual a p. Em outras palavras, seguindo o principio da parcimonia, selecionaremos 
um modelo com p regressores (p <k) que se ajuste bem aos dados. 

Na pratica, em geral representamos graficamente o C p calculado da Equa 5 ao (13.9.7) contra p. 
Um modelo “adequado” aparecera como um ponto proximo da linha C p = p, como vemos na Figura 
13.3. Essa figura mostra que o Modelo A pode ser preferivel ao B, pois esta mais proximo da linha C p 
= p que o Modelo B. 



39 DRAPER, Norman D.; SMITH, Harry. Applied regression analysis, 3. ed. Nova York: John Wiley & Sons, 1998, 
p. 332. Veja este livro para conhecer alguns exemplos elaborados de C p . 
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Uma advertencia sobre os criterios de sele^ao de modelos 

Discutimos varios criterios de selepao de modelos. Porem, eles devem ser considerados como um 
complemento aos varios testes de especificapao discutidos neste capitulo. Alguns dos criterios discu- 
tidos sao puramente descritivos e podem nao ter propriedades teoricas consistentes. Outros podem ate 
dar abertura ao data mining. No entanto, sao usados com tanta frequencia que o leitor precisa estar 
atento. Nenhum desses criterios e necessariamente superior aos demais. 40 A maioria dos programas 
de computador modernos inclui atualmente R 2 , R 2 ajustado, CIA e CIS. O criterio C p de Mallows nao 
costuma ser dado, embora possa ser calculado facilmente por meio de sua definipao. 


Previsao qui-quadrado (/ 2 ) 

Suponha um modelo de regressao embasado em n observapoes e que desejemos usa-lo para pre- 
ver os valores (medios) do regressando de t observapoes adicionais. Como mencionado, convem re- 
servar parte dos dados da amostra para verificar como o modelo estimado preve as observapoes nao 
inclui'das na amostra, o perfodo pos-amostra. 

O teste de previsao do qui-quadrado e definido como: 


Previsao, x 2 = 



(13.9.9) 


em que U; e o erro de previsao feito para o perfodo i ( = n + 1, n + 2,..., + n + t), usando os parame- 
tros obtidos na regressao ajustada e os valores dos regressores no perfodo pos-amostra; e a 2 e o esti- 
mador de MQO para o cr com base na regressao ajustada. 

Se, por hipotese, os valores dos parametros nao mudaram entre os periodos amostral e pos-amos- 
tral, pode-se constatar que a estatfstica dada na Equapao (13.9.9) segue a distribuipao de qui-quadra¬ 
do com 1 graus de liberdade, em que t e o numero de periodos para o qual a previsao e feita. Como 
observant Charemza e Deadman, o teste de previsao x 2 tem fraco poder estatistico, o que significa 
que a probabilidade de rejeitar corretamente uma falsa hipotese nula e baixa e, portanto, deve ser 
usado como um indicador e nao como um teste definitivo. 41 


13.10 Topicos adicionais sobre modelagem econometrica 

Como observado na introdupao deste capitulo, o topico da modelagem econometrica e dos testes 
de diagnostics e tao extenso e evolui tanto que comporta livros especializados a respeito. Na sepao 
anterior, tocamos em alguns dos principais pontos relativos a essa area. Nesta sepao, abordaremos 
alguns aspectos adicionais que os pesquisadores podem considerar uteis na pratica. Particularmente, 
consideraremos os seguintes topicos: (1) dados discrepantes, alavancagem e influencia; (2) mini- 
mos quadrados recursivos; e (3) teste de falhas de previsao de Chow. Examinaremos rapidamen- 
te cada um desses topicos. 

Dados discrepantes, alavancagem e influencia 42 

Lembre-se de que, ao minintizar a soma dos quadrados dos residuos (SQR), os MQO dao igual 
peso a todas as observapoes da amostra. Mas nem toda observapao pode ter igual influencia nos re- 
sultados de regressao devido a presenpa de tres tipos especiais de dados pontuais, chamados dados 


40 Para uma discussao proveitosa, veja DIEBOLD. Elements of forecasting. 2. ed. South Western Publishing, 2001, 
p. 83-89. Em resumo, Diebold recomenda o criterio CIS. 

41 CHAREMZA, Wojciech W.; DEADMAN, Derek F. New directions in econometric practice: a general to specific mo¬ 
delling, cointegration and vector autoregression. 2. ed. Edward Elgar Publishers, 1997, p. 30. Veja tambem 
p. 250-252 para conhecer a opiniao deles sobre os varios criterios de selepao de modelos. 

42 A discussao a seguir e influenciada por MUKHERJEE, Chandan; WHITE, Howard; WYUTS, Marc. Econometrics and 
data analysis for developing countries. Nova York: Routledge, 1998. p. 1 37-148. 
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discrepantes, pontos de alavancagem e pontos de influencia. E importante saber o que sao eles e 
como influenciam a analise de regressao. 

No contexto da regressao, um dado discrepante pode ser definido como uma observagao com um 
“resfduo grande”. Lembre-se de que u, — (Y t — K,), isto e, o resfduo representa a diferenga (positiva 
ou negativa) entre o valor real do regressando e seu valor estimado do modelo de regressao. Quando 
dizemos que um resfduo e grande, estamos fazendo uma comparagao com os outros resfduos e com 
frequencia esses resfduos chamam a nossa atengao imediatamente devido a sua grande distancia ver¬ 
tical em relagao a I i nil a de regressao estimada. Note que nos dados estabelecidos pode haver mais de 
um dado discrepante. Ja encontramos um exemplo disso no Exercicio 11.22, em que era pedido que 
se efetuasse a regressao da variagao percentual dos precos das agoes (Y) contra a variagao nos pregos 
ao consumidor (X) para uma amostra de 20 pafses. Uma observagao, relativa ao Chile, era um dado 
discrepante. 

Dizemos que um dado pontual exerce (grande) alavancagem se estiver desproporcionalmente 
distante da maioria dos valores de um ou mais regressores. Por que o ponto de alavancagem interes- 
sa? Porque ele e capaz de puxar a linha de regressao para si proprio, distorcendo, assim, o coeficien- 
te angular da linha de regressao. Se isso acontecer de fato, chamaremos tal ponto de alavancagem 
(de dados) de ponto de influencia. Remover esse ponto dos dados da amostra pode afetar fortemen- 
te a linha de regressao. Voltando ao Exercicio 11.22, o leitor vera que, se fizer a regressao de Y 
contra X incluindo a observagao do Chile, o coeficiente angular sera positivo e “altamente significa¬ 
tive do ponto de vista estatistico”. Mas, se excluirmos a observagao relativa ao Chile, o coeficiente 
angular sera praticamente igual a zero. Essa observagao tem alavancagem e tambem e uma observa¬ 
gao com influencia. 

Para esclarecer ainda mais a natureza dos dados discrepantes, pontos de alavancagem e de influen¬ 
cia, considere o diagrama na Figura 13.4, que e autoexplicativo. 43 


Em cada um dos graficos, a linha cheia representa a linha de MQO para todos os dados e a linha pontilhada 
representa a linha de MQO excluindo-se um dado discrepante, denotado por um HI. Em ( a ), o dado 
discrepante esta proximo do valor medio de X e tem baixa alavancagem e pouca influencia sobre os 
coeficientes de regressao. Em ( b ), o dado discrepante esta distante do valor medio de X e tem alta 
alavancagem, bem como uma influencia substancial sobre os coeficientes de regressao. Em (c), o dado 
discrepante tem alta alavancagem, mas pouca influencia sobre os coeficientes de regressao, porque esta de 
acordo com o restante das observagoes. 



43 Adaptado de FOX, John. Applied regression analysis, linear models, and related methods. California: Sage Publications, 
1997. p. 268. 
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Como lidamos com esses pontos? Deveriamos exclui-los e concentrar nossa atenpao nos dados 
remanescentes? De acordo com Draper e Smith: 

A rejei§ao automatica de dados discrepantes nem sempre e um procedimento sensato. As vezes o dado 
discrepante esta fomecendo informafoes que outros nao podem fomecer, devido ao fato de que ele 
decorre de uma combinaeao incomum de circunstancias que podem ser de interesse vital e exigem mais 
investigafao, e nao rejeijao. Como regra geral, os dados discrepantes so devem ser rejeitados se pude- 
rem ser atribufdos a causas como erros de registro das observances ou problemas de precisao de apare- 
lhos [em um experimento fisico], Caso contrario, merecem investiganao cuidadosa. 44 

Que testes podem ser usados para detectar dados discrepantes e pontos de alavancagem? Ha va- 
rios testes discutidos na literatura especifica, mas nao sao abordados aqui, porque estao alem do es- 
copo deste livro. 45 Programas como SHAZAM e MICROFIT tem rotinas para detectar dados 
discrepantes, pontos de alavancagem e de influencia. 

Mfnimos quadrados recursivos 

No Capitulo 8 examinamos a questao da estabilidade estratural de um modelo de regressao envol- 
vendo dados de series temporais e mostramos como o teste Chow pode ser empregado com esta fi- 
nalidade. Voce pode lembrar que naquele capitulo discutimos uma fun£ao de poupanga simples 
(poupanna como fun£ao de renda) para os Estados Unidos durante o perfodo 1970-2005. Vimos que 
a relanao entre poupan£a e renda provavelmente mudou por volta de 1982. Conhecendo o ponto de 
quebra estratural, conseguimos confirmar isso aplicando o teste Chow. 

Mas o que acontece se nao conhecemos o ponto (ou pontos) de quebra estratural? E nesse caso 
que podemos usar os mmimos quadrados recursivos (MQR). A ideia basica dos MQR e muito 
simples e pode ser explicada com a regressao da poupanpa contra a renda. 

Y t = + /bV, + u, 

em que Y — poupan^a e X — renda e a amostra e referente ao perfodo 1970-2005. (Veja os dados na 
Tabela 8.11.) 

Suponha que usando primeiro os dados 1970-1974 estimamos a funfao poupanpa e obtemos as 
estimativas de fix e /A Entao usamos os dados para 1970-1975 e estimamos novamente a funqao 
poupanna, obtendo as estimativas dos dois parametros. Depois, usamos os dados para 1970-1976 e 
estimamos novamente o modelo da poupan£a. Dessa forma, continuamos adicionando um dado de 
Y e X ate esgotarmos toda a amostra. Como podemos imaginar, cada regressao dara um novo con- 
junto de estimativas de fix e /A Se representarmos graficamente os valores estimados desses parame¬ 
tros contra cada iterapao, veremos como os valores dos parametros estimados alteram-se. Se o modelo 
considerado for estavel, do ponto de vista estratural, as alteranoes nos valores estimados dos dois pa¬ 
rametros serao pequenas e essencialmente aleatorias. No entanto, se os valores estimados dos 
parametros mudarem significativamente, isso indicaria uma quebra estratural. Por isso, o MQR e 
uma ferramenta util de aplicar com dados de series temporais, ja que o tempo e organizado cronolo- 
gicamente. Tambem e uma ferramenta diagnostica util em dados de corte transversal em que os da¬ 
dos sao ordenados por alguma variavel de “tamanho” ou “escala”, como o emprego ou o total dos 
ativos da empresa. O Exercicio 13.30 pede a aplicapao dos MQR aos dados de poupanpa apresenta- 
dos na Tabela 8.11. 


44 DRAPER, Norman R.; SMITH, Harry, op. cit., p. 76. 

45 Veja algumas fontes acessfveis: RENCHER, Alvin C. Linear models in statistics. Nova York: John Wiley & Sons, 
2000, p. 219-224; ATKINSON, A. C. Plots, transformations and regression: an introduction to graphical methods 
of diagnostic regression analysis. Nova York: Oxford University Press, 1985, cap. 3; SEN, Ashis; SRIVASTAVA, 
Muni. Regression analysis: Theory, methods, and applications. Nova York: Springer-Verlag, 1990, cap. 8; e 
FOX, John op. cit., cap. 11. 
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Programas como SHAZAM, EViews e MICROFIT agora efetuam estimativas dos minimos qua- 
drados recursivos como rotina. Os RELS tambem geram residuos recursivos usados como base para 
varios testes diagnoticos. 46 


Teste de falhas de previsao de Chow 

Ja discutimos o teste da estabilidade estrutural de Chow no Capftulo 8. Chow mostrou que esse teste 
pode ser modificado para verificar o poder preditivo de urn modelo de regressao. Novamente, vamos 
voltar a regressao da poupan?a contra a renda nos Estados Unidos, para o perlodo de 1970-1995. 

Imagine que estimamos a regressao para o perfodo de 1970-1981, obtendo Puo-n e Pi.io-su que 
sao os coeficientes de intercepto e angular estimados com base nos dados para o perlodo de referen- 
cia. Empregando os valores observados da renda no perfodo 1982-1995 e os valores de intercepto e 
angular para o perfodo 1970-1981, prevemos os valores dapoupan 9 a para cada um dos anos de 1982 
a 1995. A logica aqui e que, se nao houver uma grande mudan 9 a estrutural nos valores dos parame- 
tros, os valores da poupan 9 a estimados para o perfodo 1982-1995 com base nas estimativas dos para- 
metros feitas no perfodo anterior nao deverao ser muito diferentes dos valores observados da 
poupan 9 a no periodo posterior. Se houver uma grande diferen^a entre os valores observados e previs- 
tos para o perfodo posterior, isso causara duvidas sobre a estabilidade da rela 9 ao entre poupan§a e 
renda para todo o perfodo. 

Para sabermos se a diferenga entre o valor observado e o estimado da poupan 9 a e grande ou pe- 
quena, podemos efetuar o teste F, como se segue: 


( e »; 2 - e ^)/»2 

(E «/)/(«! - k) 


(13.10.1) 


em que n l = numero de observa 9 oes no primeiro perfodo (1970-1981) que foi tornado como base na 
regressao inicial, n 2 — numero de observa 9 oes no segundo perfodo, ou de previsao, E 11 1 2 = SQR 
quando a equa 9 ao e estimada para todas as observa 9 oes (n l + n 2 ), e E = SQR quando a equa 9 ao 
e estimada para as primeiras n, observa 9 oes, e k e o numero de parametros estimados (dois, no caso). 
Se os erros tiverem em distribui 9 ao normal, de forma independente e identica, a estatistica F dada na 
Equa 9 ao (13.10.1) segue a distribu^ao F com n 2 e n ] graus de liberdade, respectivamente. No Exerci- 
cio 13.31, pede-se a aplica 9 ao do teste de falhas de previsao de Chow para verificar se a rela 9 ao entre 
a poupan 9 a e a renda foi, de fato, alterada. A proposito, note a semelhan 9 a entre esse teste e o de pre¬ 
visao x 2 examinado anteriormente. 


Dados faltantes 

No trabalho aplicado nao e incomum descobrir que as vezes faltam observa 9 oes nos dados amos- 
trais. Por exemplo, nos dados de series temporais pode haver lacunas decorrentes das circunstancias 
especiais. Durante a Segunda Guerra Mundial, dados sobre variaveis macro nao eram disponiveis 
nem publicados porrazoes estrategicas. Em dados de corte tranversal, nao e raro constatar que faltam 
informa 9 oes sobre alguns indivfduos, principalmente em dados coletados de pesquisas feitas com 
questionarios. Tambem em dados obtidos de paineis, com o tempo alguns entrevistados deixam de 
responder ou de fornecer informa 9 oes a todas as perguntas. 

Qualquer que seja a razao, a falta de dados e um problema que todo pesquisador enfrenta de vez 
em quando. A questao e como lidar com isso. Ha uma maneira de imputar valores as observa 9 oes 
que faltam? 

Essa nao e uma pergunta facil de responder. Embora haja solugoes elaboradas sugeridas na litera- 
tura especifica, nao trataremos delas aqui por serem muito complexas. 47 No entanto, discutiremos 


46 Para detalhes, veja JOHNSTON, Jack; DINARDO, John. Econometric methods. 4. ed. Nova York: McGraw-Hill, 
1997. p. 117-121. 

47 Para um tratamento complete, mas bastante avanijado do assunto, veja CAMERON, A. Colin; TRIVEDI, Pravin K. 
Microeconometrics: methods and applications. Nova York: Cambridge University Press, 2005. cap. 27, p. 923-941. 
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dois casos. 48 No primeiro, as razoes para os dados que faltam sao independentes das observagoes 
disponfveis, chamadas por Darnell de “caso ignoravel”. Na segunda situagao, alem de dados disponf- 
veis incompletos, as observagoes que faltam podem estar sistematicamente relacionadas com os da¬ 
dos disponfveis. Esse e um caso mais serio, pois pode resultar do vies de autosselegdcr, os dados 
observados nao sao, de fato, coletados aleatoriamente. 

No caso ignoravel, podemos apenas ignorar as observagoes que faltam e usar aquelas que estao 
disponfveis. A maioria dos programas estatfsticos faz isso automaticamente. Desse modo o tamanho 
da amostra sera reduzido e podemos nao ser capazes de obter estimativas exatas dos coeficientes de 
regressao. Poderfamos usar os dados disponfveis, no entanto, para esclarecer as observagoes que 
faltam. Consideraremos tres possibilidades: 

1. De um numero total de observagoes de N, temos dados completos sobre N l (N l < N) tanto 
para o regressando quanto para os k regressores denotados por P, e X h respectivamente. 
(F x e vetor de N\ observagoes e A, e um vetor linha com k regressores). 

2. Para algumas observagoes (N 2 < AO ha dados completos sobre o regressando, denotados por 
P 2 , mas observagoes incompletas sobre alguns X 2 (novamente, estes sao vetores). 

3. Para algumas observagoes (N 3 < N), nao ha dados sobre P, mas dados completos sobre X, 
denotados por X 3 . 

No primeiro caso, a regressao de P, sobre A, produzira estimativas dos coeficientes de regressao 
que sao nao tendenciosos, mas podem nao ser eficientes, porque ignoramos as observagoes N 2 e N 3 . 
As outras duas situagoes sao bastante complicadas e deixamos para o leitor consultar as references 
para as solugoes. 49 


13.11 Exemplos conclusivos 

Concluimos este capitulo com dois exemplos que ilustram um ou mais pontos aqui abordados. O 
primeiro deles, sobre determinagao de salario, usa dados de corte transversal e o segundo, que consi- 
dera a fungao consumo real para os EUA, usa dados de serie temporal. 

1. Um modelo para determinagao de salario por hora 

Para examinarmos quais os fatores que determinam o salario por hora, vamos considerar um mo¬ 
delo baseado em Mincer, que se tomou conhecido entre os economistas do trabalho. Esse modelo tem 
a seguinte forma: 50 

In salario, = + ftEdu, + ^Exp, + /3 4 Fe; + ftNW, + /3 6 UN, + /UWK, + w, (13.11.1) 

em que In salario = logaritmo natural do salario por hora ($); Edu = anos de escolaridade; Exp = ex- 
periencia no mercado de trabalho; Fe = 1 se for mulher, 0 caso contrario; NW = I se nao for branco, 0 
caso contrario; UN = 1 se for sindicalizado, 0 caso contrario; e WK = 1 trabalhadores que nao recebem 
por hora, 0 caso contrario. Para os trabalhadores que nao recebem por hora, o salario por hora e calcu- 
lado como os ganhos semanais divididos pelo numero de horas trabalhadas. 

Outras variaveis poderiam ser adicionadas a esse modelo. Algumas delas sao origem etnica, esta- 
do civil, numero de filhos com menos de 6 anos e riqueza ou renda obtida que nao do trabalho. Por 
ora, trabalharemos com o modelo da Equagao (13.11.1). 


48 A discussao a seguir baseia-se em DARNELL, Adrian C. A dictionary of econometrics. Lyne, Reino Unido: Edward 
Elgar Publishing, 1994. p. 256-258. 

49 Alem das references ja citadas, veja AFIFI, A. A.; ELASHOFF, R. M. "Missing observations in multivariate statistics." 
journal of the American Statistical Association, 1967. v. 61, p. 595-604,1966, e v. 62, p. 10-29. 

50 Veja MINCER, J. School, experience and earnings. Nova York: Columbia University Press, 1974. 
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Os dados consistem em 1.289 pessoas entrevistadas em margo de 1985 como parte da Current 
Population Survey (CPS), um levantamento conduzido periodicamente pelo U.S. Census Bureau, 
orgao que realiza o censo demografico nos Estados Unidos. Esses dados foram coletados original- 
mente por Paul Rudd. 51 

A priori , poderiamos esperar ter uma influencia positiva nos salarios. As variaveis binarias Fe e 
NW devem ter um impacto negativo nos salarios, se houver um tipo de discriminagao, e espera-se que 
UN tenha um impacto positivo em virtude da incerteza da renda. 

Quando todas as variaveis binarias tiverem um valor de zero, a Equagao (13.11.1) reduz-se a 

In salario, = f’>\ + /^Edu, + /j 3 Exp, + u, (13.11.2) 

que e a fungao salario para um trabalhador branco, do genero masculino, nao sindicalizado, que ganha 
por hora. Essa e a categoria de base, de referenda. 

Agora vamos apresentar os resultados de regressao e discuti-los. 


TABELA 13.4 

Resultados da 
regressao 

no EViews com base 
na Equagao (13.11.1) 


Dependent 

Variable: 

LW 




Method: Least Squares 




Sample: 1 

-1,289 





Included 

observations: 1,289 




Coefficient 

Std. 

Error 

t Statistic 

Prob. 

C 

1.037880 

0.074370 

13.95563 

0.0000 

EDU 

0.084037 

0.005110 

16.44509 

0.0000 

EXP 

0.011152 

0.001163 

9.591954 

0.0000 

FE 

-0.234934 

0.026071 

-9.011170 

0.0000 

NW 

-0.124447 

0.036340 

-3.424498 

0.0006 

UN 

0.207508 

0.036265 

5.721963 

0.0000 

WK 

0.228725 

0.028939 

7.903647 

0.0000 

R-squared 


0.376053 

Mean 

dependent var. 

2.342416 

Adjusted 

R-squared 

0.373133 

S.D. 

dependent var. 

0.586356 

S.E. of regression 

0.464247 

Akaike info criterion 

1.308614 

Sum squared resid. 

276.3030 

Schwarz criterion 

1.336645 

Log likelihood 

-836.4018 

Hannan-Quinn criter. 

1.319136 

F-statistic 

128.7771 

Durbin-Watson stat. 

1.977004 

Prob. (F- 

statistic) 

0.000000 





A primeira observagao a fazer e que todos os coeficientes estimados sao, individualmente, alta- 
mente significativos, pois os p-valores sao muito baixos. A estatisca F tambem e muito alto, sugerin- 
do que coletivamente todas as variaveis sao importantes do ponto de vista estatfstico. 

Em comparagao ao trabalhador tornado como referenda, o salario medio de uma trabalhadora e 
de um trabalhador nao branco e mais baixo. Os trabalhadores sindicalizados e aqueles que recebem 
por semana ganham, em media, salarios mais altos. 

Em que medida esse modelo e adequado (13.11.1), tendo em vista as variaveis que consideramos? 
E posslvel que mulheres nao brancas que trabalham ganhem menos que as mulheres brancas? E pos- 
sfvel que mulheres nao brancas e nao sindicalizadas ganhem menos que as mulheres brancas e nao 
sindicalizadas? Em outras palavras, ha qualquer efeito interativo entre os regressores quantitativos e 
as variaveis binarias? 


51 RUDD, Paul A. An introduction to classical econometric theory. Nova York: Oxford University Press, 2000. Nao 
inclufmos dados sobre idade, porque sao altamente colineares com a experience de emprego. 
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Os programas de estatistica tem rotinas para responder a essas perguntas. Por exemplo, o EViews 
tem esse recurso. Depois de estimar um modelo, se voce achar que algumas variaveis podem ser adi- 
cionadas ao modelo, mas nao tem certeza da importancia delas, faga o teste de variaveis omitidas. 

Para tanto, suponha que a Equaqao (13.11.1) tenha sido estimada e agora queiramos descobrir se 
os produtos de Fe e NW, FE e UN, e FE e WK deveriam ser adicionados ao modelo para levar em 
conta a interacjao entre as variaveis explanatorias. Usando a rotina do EViews 6, obtemos a seguinte 
resposta: a hipotese nula e que essas tres variaveis adicionadas nao tem efeito no modelo estimado. 

Como poderfamos suspeitar, podemos usar o teste F (discutido no Capftulo 8) para avaliar a con- 
tribui£ao incremental, ou marginal, das variaveis adicionadas e testar a hipotese nula. Para nosso 
exemplo, os resultados sao os seguintes: 


TABELA 13.5 

Resultados parciais 
com o EViews, 
usando 
intera§oes 

Nao rejeitamos a hipotese nula de que a interagao entre mulher/nao branca, mulher/sindicato e 
mulher/trabalhadores que ganham salarios por semana, coletivamente, nao tenha impacto significati¬ 
ve no modelo estimado dado na Tabela 13.4, pois o valor F estimado de 0,8053 nao e estatisticamen- 
te significativo, com p-valor cerca de 49%. 

Deixamos isso para o leitor tentar outras combina 9 oes dos regressores para avaliar sua contri- 
bui£ao ao modelo original. 

Antes de prosseguir, o modelo (13.11.1) sugere que a influencia da experiencia sobre o logaritmo 
dos salarios e linear, isto e, mantendo as demais variaveis constantes, o aumento relativo nos salarios 
(lembre-se de que o regressando esta na forma logarftmica) permanece o mesmo para o acrescimo 
de cada ano na experiencia profissional. Essa hipotese pode ser verdadeira, com alguns anos de ex¬ 
periencia, mas como a economia do trabalo sugere, a medida que os trabalhadores ficam mais ve- 
lhos, a proporpao de aumento nos salarios diminui. Para verificarmos se esse e o caso em nosso 
exemplo, adicionamos o termo de experiencia elevado ao quadrado ao nosso modelo inicial e obti- 
vemos os seguintes resultados: 


Omitted Variables: FE*NW FE*UN FE*WK 


F-statistic 0.805344 Prob. F (3,1279) 0.4909 

Log likelihood ratio 2.432625 Prob. chi-square (3) 0.4876 


TABELA 13.6 

Resultados do EViews 
com a experiencia 
elevada ao quadrado 


Dependent Variable: LW 
Method: Least Squares 
Sample: 1-1,289 

Included observations: 

1,289 




Coefficient 

Std. Error 

t Statistic 

Prob. 

C 

0.912279 

0.075151 

12.13922 

0.0000 

EDU 

0.079867 

0.005051 

15.81218 

0.0000 

EXP 

0.036659 

0.003800 

9.647230 

0.0000 

FE 

-0.228848 

0.025606 

-8.937218 

0.0000 

NW 

-0.121805 

0.035673 

-3.414458 

0.0007 

UN 

0.199957 

0.035614 

5.614579 

0.0000 

WK 

0.222549 

0.028420 

7.830675 

0.0000 

EXP*EXP 

-0.000611 

8.68E-05 

-7.037304 

0.0000 

F-squared 

0. 

.399277 Mean 

dependent var. 

2.342416 

Adjusted 

F-squared 0. 

.395995 S.D. 

dependent var. 

0.586356 


S.E. of regression 0.455703 
Sum squared resid. 266.0186 
Log likelihood -811.9549 
F-statistic 121.6331 
Prob. (F-statistic) 0.000000 


Akaike info criterion 
Schwarz criterion 
Hannan-Quinn criter. 
Durbin-Watson stat. 


1.272234 
1.304269 
1.284259 
1.971753 
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0 termo de experiencia elevado ao quadrado nao so e negativo mas tambem e altamente signifi- 
cativo do ponto de vista estatfstico. Ele esta de acordo com o comportamento do mercado de trabalho; 
i • , . , / 3 Iw 

com o tempo, a taxa de crescimento de salarios desacelera - = 0,0366 - 0,0012EXP 

\3EXP 

Aproveitamos esta oportunidade para discutir os criterios de Akaike e Schwarz. Como o R 2 , esses sao 
os testes da qualidade do ajustamento do modelo estimado; a diferenga e que sob o criterio R 2 quanto mais 
alto for o seu valor, mais o modelo explica o comportamento do regressando. Por outro lado, sob os cri¬ 
terios de Akaike e Schwarz, quanto mais baixo for o valor dessas estatisticas, melhor sera o modelo. 

Todos esses criterios fazem sentido se queremos comparar dois ou mais modelos. Se voce com- 
parar o modelo da Tabela 13.4 com o da Tabela 13.6, que tem a experiencia elevada ao quadrado 
como um regressor adicional, vera que o modelo na Tabela 13.6 e preferfvel ao da 13.4 com base nos 
tres criterios. 

A proposito, note que em ambos os modelos os valores de R 2 parecem “baixos”, mas estes valo- 
res baixos sao observados tipicamente nos dados de corte transversal com um grande numero de 
observagoes. No entanto, note que esse valor “baixo” de R 2 e significativo estatisticamente; em am¬ 
bos os modelos a estatfstica F calculada e altamente significativa (lembre-se da relagao entre F e R 2 
discutida no Capftulo 8). 

Vamos continuar com o modelo estendido da Tabela 13.6. Embora pare 9 a satisfatorio, explo- 
raremos alguns pontos. Primeiro, uma vez que estamos lidando com dados de corte transversal, ha 
chances de que o modelo sofra de heterocedasticidade. Logo, precisamos descobrir se esse e o 
caso. Aplicamos varios dos testes de heterocedasticidade discutidos no capftulo lie descobrimos 
que o modelo, de fato, sofre de heterocedasticidade. O leitor deveria verificar essa afirmagao. 

Para fazermos a corregao para a heterocedasticidade observada, podemos obter os erros padrdo 
consistentes para heterocedasticidade de White , discutidos no Capftulo 11. Os resultados estao na 
tabela a seguir. 


TABELA 13.7 

Resultados do EViews 
usando a corregao de 
White dos erros 
padrao 


Dependent Variable: LW 
Method: Least Squares 
Sample: 1-1,289 
Included observations: 1,289 

White's Heteroscedasticity-Consistent Standard Errors 
and Covariance 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c 

0.912279 

0.077524 

11.76777 

0.0000 

EDU 

0.079867 

0.005640 

14.15988 

0.0000 

EXP 

0.036659 

0.003789 

9.675724 

0.0000 

FE 

-0.228848 

0.025764 

-8.882625 

0.0000 

NW 

-0.121805 

0.033698 

-3.614573 

0.0003 

UN 

0.199957 

0.029985 

6.668458 

0.0000 

WK 

0.222549 

0.031301 

7.110051 

0.0000 

EXP*EXP 

-0.000611 

9.44E-05 

-6.470218 

0.0000 


R -squared 

0.399277 

Mean dependent var. 

2.342416 

Adjusted E-squared 

0.395995 

S.D. dependent var. 

0.586356 

S.E. of regression 

0.455703 

Akaike info criterion 

1.272234 

Sum squared resid. 

266.0186 

Schwarz criterion 

1.304269 

Log likelihood 

-811.9549 

Hannan-Quinn criter. 

1.284259 

F-statistic 

121.6331 

Durbin-Watson stat. 

1.971753 

Prob. (F-statistic) 

0.000000 




Como esperavamos, ha algumas mudangas nos erros padrao estimados, tornados individual e 
coletivamente, ao explicarmos o comportamento dos salarios relativos. 
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Agora vamos examinar se os termos de erro sao normalmente distribuidos. O histograma dos re¬ 
siduos obtidos do modelo na Tabela 13.7 e apresentado na Figura 13.5. 

A estatfstica de Jarque-Bera (JB) rejeita a hipotese de distribu^ao normal dos erros, pois e alta e 
o p -valor e praticamente zero: observe que, para uma variavel normalmente distribulda, os coeficien- 
tes de simetria e curtose sao, respectivamente, 0 e 3. 

E entao? Nosso procedimento de teste da hipotese ate aqui consistiu no pressuposto de que o 
termo de erro no modelo de regressao apresenta distribui^ao normal. Isso significa que nao podemos 
usar legitimamente os testes t e F para verificar as hipoteses na regressao do salario? 

A resposta e nao. Como notado no capitulo, os estimadores MQO sao distribuidos assintoticamen- 
te com o caveat observado no capitulo, a saber, que o termo de erro tem variancia finita, e homocedas- 
tico e o valor medio do termo de erro, dados os valores das variaveis explanatorias, e zero. Como 
resultado, podemos continuar a usar os testes usuais t e F, contanto que a amostra seja razoavelmente 
grande. A proposito, pode-se observar que nao precisamos da hipotese de normalidade para obter os 
estimadores MQO. Mesmo sem a hipotese de normalidade, os estimadores MQO sao os melhores es¬ 
timadores nao tendenciosos (MELNT) sob as condigocs do teorema de Gauss-Markov. 

Qual o tamanho da amostra? Nao ha resposta definitiva para essa pergunta, mas o tamanho da 
amostra de 1.289 observa£6es na regressao de salarios parece ser razoavelmente grande. 

Ha “dados discrepantes” em nossa regressao de salarios? Pode-se ter uma ideia disso por 
meio do grafico da Figura 13.6, que apresenta os valores observado e estimado da variavel 


FIGURA 13.5 

Histograma dos 
residuos obtidos da 
regressao na Tabela 
13.7. 


FIGURA 13.6 

Residuos versus 
valores estimados da 
variavel dependente, 
logaritmo do salario. 
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Series: Residuos 

Amostra: 1-1.289 
observances: 1.289 

Media 

-9,38e-09 

Mediana 

-0,850280 

Maximo 

48,92719 

Mfnimo 

-20,58590 

Desv. padrao 

6,324574 

Simetria 

1,721323 

Curtose 

10,72500 

Jarque-Bera 

3841,617 

Probabilidade 

0,000000 
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dependente (In salario) e os resfduos que sao diferengas entre os valores observado e estimado 
do regressando. 

Embora o valor medio dos residuos seja sempre zero (por que?), o grafico na Figura 13.6 mos- 
tra que ha varios residuos que parecem grandes (em valor absoluto) comparados a maioria dos 
resfduos. E possfvel que haja dados discrepantes nos dados. Fornecemos as estatfsticas primarias 
sobre as tres variaveis quantitativas na Tabela 13.8 para ajudar o leitor a decidir se de fato ha da¬ 
dos discrepantes. 


TABELA 13.8 


Sample: 1-1,289 


W 

EDU 

EXP 

Mean 

12.36585 

13.14507 

18.78976 

Median 

10.08000 

12.00000 

18.00000 

Maximum 

64.08000 

20.00000 

56.00000 

Minimum 

0.840000 

0 . 000000 

0 . 000000 

Std. Dev. 

7.896350 

2.813823 

11.66284 

Skewness 

1.848114 

-0.290381 

0.375669 

Kurtosis 

7.836565 

5.977464 

2.327946 

Jarque-Bera 

1990.134 

494.2552 

54.57664 

Probability 

0.000000 

0 . 000000 

0 . 000000 

Sum 

15939.58 

16944.00 

24220.00 

Sum Sq. Dev. 

80309.82 

10197.87 

175196.0 

Observations 

1,289 

1,289 

1,289 


2. Fun^ao de consumo real para os Estados Unidos, 1947-2000 

No Capftulo 10 consideramos a fungao de consumo para os Estados Unidos, para o perfodo de 
1947-2000. A forma especifica da fungao de consumo que consideramos foi: 

lnTC ( = P\ + ^InYD t + /S 3 lnW+ Interest t + u t (13.11.3) 


em que TC, YD, W e Interest sao, respectivamente, cosumo total, a renda disponivel pessoal, a rique- 
za, alem da taxa de juros, tudo em termos reais. Os resultados baseados em nossos dados sao os 
seguintes: 


TABELA 13.9 

Resultados da 
equagao de regressao 
(13.11.3) 


Method: Least Squares 
Sample: 1947-2000 
Included observations: 


54 



Coefficient 

Std. Error 

t Statistic 

Prob. 

C 

-0.467711 

0.042778 

-10.93343 

0.0000 

LOG(YD) 

0.804873 

0.017498 

45.99836 

0.0000 

LOG(WEALTH) 

0.201270 

0.017593 

11.44060 

0.0000 

INTEREST 

-0.002689 

0.000762 

-3.529265 

0.0009 


R-squared 

0.999560 

Mean dependent var. 

7.826093 

Adjusted R-squared 

0.999533 

S.D. dependent var. 

0.552368 

S.E. of regression 

0.011934 

Akaike info criterion 

-5.947703 

Sum squared resid. 

0.007121 

Schwarz criterion 

-5.800371 

Log likelihood 

164.5880 

Hannan-Quinn criter. 

-5.890883 

E-statistc 

37832.59 

Durbin-Watson stat. 

1.289219 

Prob. (E-statistic) 

0.000000 
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Ja que TC, YD e riqueza entram na forma logaritmica, os coeficientes angulares de YD e riqueza 
sao, respectivamente, elasticidades da renda e riqueza. Como era de esperar, essas elasticidades sao 
positivas e altamente significativas, em termos estatisticos. Numericamente, as elasticidades renda e 
riqueza sao cerca de 0,80 e 0,20. O coeficiente da variavel taxa de juros representa a semielasticidade 
(por que?). Mantendo as demais variaveis constantes, os resultados mostram que, se a taxa de juros 
subir em 1 ponto percentual, a despesa real de consumo descera em cerca de 0,27%. Note que a se¬ 
mielasticidade estimada tambem e altamente significativa, em termos estatisticos. 

Veja o resumo de alguns dados estatisticos. O valor de R 2 e muito alto, chegando a quase 100%. 
O valor de F tambem e altamente significativo, em termos estatisticos, sugerindo que, nao so indivi- 
dualmente, mas tambem de maneira coletiva, todas as variaveis explanatorias tem um impacto signi¬ 
ficativo nas despesas de consumo. 

Entretanto, a estatfstica de Durbin-Watson sugere que ha uma correlagao serial entre os erros no 
modelo. Se consultarmos as tabelas de Durbin-Watson (Tabela D.5 no Apendice D), vemos que, para 
55 observances (o numero mais proximo de 54) e tres variaveis explanatorias, os valores criticos d 
sao 1,452 e 1,681. Como o valor d observado em nosso exemplo, 1,2892, esta abaixo dos valores 
criticos de d, podemos concluir que os erros em nossa fun£ao de consumo estao correlacionados po- 
sitivamente. Essa nao deveria ser uma constatagao surpreendente; na maioria das vezes as regressoes 
em serie temporais apresentam autocorrelanao. 

Antes de aceitarmos essa conclusao, vamos descobrir se ha erros de especificatjao. Como sabe- 
mos, as vezes a autocorrela^ao pode ser evidente, porque omitimos algumas variaveis importantes. 
Para tanto, consideraremos a regressao obtida na Tabela 13.10. 


TABELA 13.10 


Dependent Variable: LTC 
Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c 

2.689644 

0.566034 

4.751737 

0.0000 

LYD 

0.512836 

0.054056 

9.487076 

0.0000 

LW 

-0.205281 

0.074068 

-2.771510 

0.0079 

INTEREST 

-0.001162 

0.000661 

-1.759143 

0.0848 

LYD*LW 

0.039901 

0.007141 

5.587986 

0.0000 


R -squared 

0.999731 

Mean dependent var. 

7.826093 

Adjusted R-squared 

0.999709 

S.D. dependent var. 

0.552368 

S.E. of regression 

0.009421 

Akaike info criterion 

-6.403689 

Sum squared resid. 

0.004349 

Schwarz criterion 

-6.219524 

Log likelihood 

177.8996 

Hannan-Quinn criter. 

-6.332663 

F-statistic 

45534.94 

Durbin-Watson Stat. 

1.530268 

Prob. (F-statistic) 

0.000000 




A variavel adicional nesse modelo e a intera£ao dos logaritmos da renda e riqueza disponlveis. 
Esse termo de intera?ao e altamente significativo. Agora a variavel juros tornou-se menos significati¬ 
va (p-valor de cerca de 8%), embora tenha o sinal negativo. Mas o valor d de Durbin-Watson aumen- 
tou de cerca de 1,28 para cerca de 1,53. 

Os valores criticos a 5% de significancia agora sao 1,378 e 1,721. O valor d observado 1,53 situa-se 
entre esses valores, sugerindo que, com base na estatfstica de Durbin-Watson, nao podemos determi- 
nar se temos ou nao autocorrcla^ao. Entretanto, o valor d observado esta mais proximo do limite su¬ 
perior. Como visto no capftulo sobre autocorrela 9 ao, alguns autores sugerem usar o limite superior da 
estatfstica d aproximadamente como o verdadeiro limite de significancia; se o valor d calculado 
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estiver abaixo do limite superior, ha evidencia de autocorrelacjao positiva. Por esse criterio, no exem- 
plo podemos concluir que nosso modelo sofre de autocorrela 5 ao positiva. 

Tambem aplicamos o teste de autocorrelatjao de Breusch-Godfrey discutido no Capitulo 12. 
Adicionando os dois termos defasados dos resfduos estimados naEqua£ao (12.6.15) ao modelo 
na Tabela 13.9, obtemos os seguintes resultados: 


TABELA 13.11 


Breusch-Godfrey Serial Correlation LM Test: 

F-statistic 3.254131 

Obs*F-squared 6.447576 

Prob. F(2,48) 

Prob. chi-square (2) 

0.0473 

0.0398 


Dependent Variable: RESID 
Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 

Presample missing value lagged residuals set to zero. 


Coefficient Std. Error t Statistic Prob. 


C 

-0.006514 

0.041528 

-0.156851 

0.8760 

LYD 

-0.004197 

0.017158 

-0.244619 

0.8078 

LW 

0.004191 

0.017271 

0.242674 

0.8093 

INTEREST 

0.000116 

0.000736 

0.156964 

0.8759 

RESID(-1) 

0.385190 

0.151581 

2.541147 

0.0143 

RESID(-2) 

-0.165609 

0.154695 

-1.070556 

0.2897 


R -squared 

0.119400 

Mean dependent var. 

-9.02E-17 

Adjusted R-squared 

0.027670 

S.D. dependent var. 

0.011591 

S.E. of regression 

0.011430 

Akaike info criterion 

-6.000781 

Sum squared resid. 

0.006271 

Schwarz criterion 

-5.779782 

Log likelihood 

168.0211 

Hannan-Quinn criter. 

-5.915550 

F-statistic 

1.301653 

Durbin-Watson Stat. 

1.848014 

Prob. (F-statistic) 

0.279040 




O Freportado no topo da tabela testa a hipotese de que os dois resfduos defasados no mode¬ 
lo tem valores iguais a zero. Essa hipotese e rejeitada, porque o Fe significativo ao nivel apro- 
ximado de 5%. 

Para resumir, parece haver autocorrela§ao no termo de erro. Podemos aplicar um ou mais 
procedimentos discutidos no Capftulo 12 para remover a autocorrela 5 ao. Para pouparmos espa- 
50 , deixamos essa tarefa ao leitor. 

Na Tabela 13.12 relatamos os resultados da analise de regressao que apresentam os erros padrao 
de Newey-West ou CHA que levam em conta a autocorrela§ao. O tamanho de nossa amostra de 54 
observa 5 oes e grande o suficiente para usar os erros padrao CHA. Se voce comparar esses resultados 
com os da Tabela 13.9, observara que os coeficientes de regressao permanecem os mesmos, mas 
os erros padrao sao um pouco diferentes. 

Neste capftulo, discutimos o teste de falha de previsao de Chow. Temos um perfodo amostral que 
se estende de 1947 a 2000. Nesse perfodo, tivemos varios ciclos de negocio, a maioria de curta dura- 
9 ao. Por exemplo, houve uma recessao em 1990 e outra em 2000. O comportamento das despesas de 
consumo em rclagao a renda, riqueza e taxa de juros e diferente durante as recessoes? 

Para elucidarmos a questao, vamos considerar a recessao de 1990 e aplicar o teste de falha de 
previsao de Chow. Os detalhes desse teste ja foram discutidos no capftulo. Usando o teste de falha 
na previsao de Chow na versao 6 do EViews, obtemos os resultados da Tabela 13.13. 
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TABELA 13.12 


TABELA 13.13 

Teste de falha de 
previsao de Chow 


Dependent Variable: LTC 
Method: Least Squares 
Sample: 1947-2000 
Included observations: 54 

Newey-West HAC Standard Errors and Covariance (lag 
truncation = 3) 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c 

-0.467714 

0.043937 

-10.64516 

0.0000 

LYD 

0.804871 

0.017117 

47.02132 

0.0000 

LW 

0.201272 

0.015447 

13.02988 

0.0000 

INTEREST 

-0.002689 

0.000880 

-3.056306 

0.0036 


R -squared 

Adjusted R-squared 
S.E. of regression 
Sum squared resid. 
Log likelihood 
E-statistic 

Prob. (F-statistic) 

0.999560 

0.999533 

0.011934 

0.007121 

164.5881 

37832.71 

0.000000 

Mean dependent var. 

S.D. dependent var. 
Akaike info criterion 

Schwarz criterion 
Hannan-Quinn criter. 
Durbin-Watson Stat. 

7.826093 

0.552368 

-5.947707 

-5.800374 

-5.890886 

1.289237 





Chow's Forecast Test 

: Forecast 

from 1991 to 2000 


F-statistic 

1.957745 

Prob. F (10,40) 

0.0652 

Log likelihood ratio 

21.51348 

Prob. chi-square (10) 

0.0178 

Dependent Variable: 

LTC 




Method: Least Squares 
Sample: 1947-1990 
Included observations: 44 



Coefficient 

Std. Error 

t Statistic 

Prob. 

C 

-0.287952 

0.095089 

-3.028236 

0.0043 

LYD 

0.853172 

0.028473 

29.96474 

0.0000 

LW 

0.141513 

0.033085 

4.277239 

0.0001 

INTEREST 

-0.002060 

0.000804 

-2.562790 

0.0143 


R -squared 

0.999496 

Mean dependent var. 

7.659729 

Adjusted R-squared 

0.999458 

S.D. dependent var. 

0.469580 

S.E. of regression 

0.010933 

Akaike info criterion 

-6.107640 

Sum squared resid. 

0.004781 

Schwarz criterion 

-5.945441 

Log likelihood 

138.3681 

Hannan-Quinn criter. 

-6.047489 

F-statistic 

26430.49 

Durbin-Watson Stat. 

1.262748 

Prob. (F-statistic) 

0.000000 




O F estatfstico dado na parte superior da Tabela 13.13 sugere que provavelmente nao ha diferen 9 a 
substancial na fun£ao de consumo pre e pos 1990, pois seu p-valor nao e significativo ao nivel de 5%. 
Mas, se escolhermos o nivel de significancia de 10%, o valor F sera estatisticamente significativo. 

Podemos examinar esse problema de um modo diferente. No Capitulo 8 discutimos um tes¬ 
te de estabilidade de parametro. Para verificarmos se ha qualquer alterac^ao estatisticamente 
significativa nos coeficientes de regressao da fungao de consumo, usamos o teste Chow discuti- 
do na Sec^ao 8.7 do Capitulo 8 e obtivemos os resultados da Tabela 13.14. 
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TABELA 13.14 

Teste da 
estabilidade de 
parametro de 
Chow 


Chow Breakpoint Test: 1990 

Null Hypothesis: No breaks at specified breakpoints 
Varying regressors: All equation variables 
Equation Sample: 1947-2000 

F-statistic 4.254054 Prob. F(4,46) 0.0052 

Log likelihood ratio 16.99654 Prob. chi-square (4) 0.0019 

Wald statistic 17.01622 Prob. chi-square (4) 0.0019 


Parece que a fungao consumo pre e pos 1990 e estatisticamente diferente, pois o F estatfstico 
calculado, seguindo a Equagao (8.7.4), e altamente significative) em termos estatisticos, porque o 
p-valor e de apenas 0,0052. 

O leitor e incentivado a aplicar os testes de previsao de falhas e de estabilidade de Chow, para 
determinar se a fungao consumo pre e pos 2000 mudou. Para tanto, voce tera de ir alem dos dados de 
2000. Observe tambem que, para aplicar esses testes, o numero de observagoes deve ser maior que o 
numero de coeficientes estimados. 

Esgotamos todos os testes diagnosticos que podemos aplicar aos nossos dados de consumo, mas 
a analise fornecida ate aqui deve dar uma boa ideia sobre como podemos aplicar os diversos testes. 


13.12 Erros nao normals e regressores estocasticos 


Nesta segao discutiremos dois topicos de natureza avangada: a distribuigao nao normal do termo 
de erro e regressores estocasticos, ou aleatorios, e sua importancia pratica. 

1. O que acontece se o termo de erro nao tem distribuigao normal? 

No modelo classico de regressao linear normal (MCRLN) discutido no Capftulo 4, supusemos 
que o termo de erro it segue a distribuigao normal. Recorremos ao teorema central do limite (TCL) 
para justificar a hipotese de normalidade. Devido a essa hipotese, conseguimos estabelecer que os 
estimadores MQO tambem sao normalmente distribufdos. Como resultado, conseguimos fazer o tes¬ 
te de hipotese usando os testes t e F independentemente do tamanho da amostra. Tambem discutimos 
o emprego dos testes de normalidade Jarque-Bera e Anderson-Darling para verificar se os erros 
estimados sao distribufdos normalmente em qualquer aplicagao pratica. 

O que acontece se os erros nao sao normalmente distribufdos? Podemos dizer que os estima¬ 
dores MQO ainda sao MELNT, isto e, eles sao nao tendenciosos e na categoria de estimadores 
lineares que mostram variancia minima. Isso nao deveria surpreender, pois para estabelecer o teorema 
de Gauss-Markov (BLUE) nao precisamos da hipotese de normalidade. 

Entao, qual e o problema? 

O problema e que precisamos de distributes amostrais ou de probabilidade dos estimadores 

de MQO. Sem isso nao podemos abragar qualquer teste de hipotese relativo aos verdadeiros valo- 
res desses estimadores. Como e mostrado nos Capftulos 3 e 7, os estimadores MQO sao fungoes 
lineares da variavel dependente 7,eo proprio Y e uma fungao linear do termo de erro estocastico u, 
supondo que as variaveis explanatorias sejam nao estocasticas ou fixas na amostragem repetida. Por 
fim, precisamos da distribuigao probabilistica de u. 

Como foi notado, o modelo classico de regressao linear normal (MCRLN) pressupoe que o termo 
de erro siga a distribuigao normal (com media zero e variancia constante). Usando o teorema central 
do limite (TCL) para justificar a normalidade do termo de erro, conseguimos mostrar que os proprios 
estimadores MQO tem distribuigao normal com medias e variancia discutidas nos Capftulos 4 e 7. 
Isso, por sua vez, permitiu usar as estatfsticas t e F no teste de hipotese em amostras pequenas, ou 
finitas, bem como em amostras grandes. O papel da hipotese de normalidade e fundamental, princi- 
palmente em amostras pequenas. 
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Mas e se nao pudermos manter a hipotese de normalidade com base nos varios testes de normali- 
dade? Temos duas oppoes. A primeira e o metodo de reamostragem (bootstrapping) e a segunda e 
recorrer a teoria de amostras grandes ou propriedades assintoticas. 

Uma discussao do metodo de reamostragem, que esta sendo assimilada gradualmente pela econo- 
metria, nos distanciara do assunto deste livro. A ideia basica do metodo de reamostragem e utilizar 
(ou regurgitar) determinada amostra varias vezes e obter as distributes amostrais dos parametros de 
interesse (estimadores MQO para nossa finalidade). O leitor podera consultar as referencias para sa¬ 
ber como isso e feito na pratica. 52 A proposito, o termo bootstrapping (bootstrap e a tira atras da bota, 
ou lingueta, que se puxa para calpa-la) e usado em expressao popular na lingua inglesa e quer dizer 
“melhorar na vida a custa de seu proprio esforpo”. 

A outra abordagem para lidar com termos de erro nao normais consiste em usar a teoria de amos¬ 
tras grandes ou assintotica. O Apendice 3A.7 do Capitulo 3 deu uma ideia desse assunto, em que 
mostramos que os estimadores MQO sao consistentes. Como discutido no Apendice A, um estima- 
dor e consistente se aborda o valor verdadeiro do estimador a medida que o tamanho da amostra au- 
menta (veja a Figura A. 11 no Apendice A). 

Mas, como isso nos ajuda a testar a hipotese? Ainda podemos usar os testes t e FI Podemos mos- 
trar que sob as hipoteses de Gauss-Markov os estimadores MQO tem distribuipao assintotica nor¬ 
mal com medias e variancias discutidas nos Capftulos 4 e 7. 53 Como resultado, os testes t e F 
desenvolvidos sob a hipotese da normalidade sao aproximadamente validos em amostras grandes. A 
aproximapao toma-se boa a medida que o tamanho da amostra cresce. 54 

2. Variaveis explanatorias estocasticas 

No Capitulo 3 introduzimos o modelo classico de regressao linear (em parametro) sob alguns pres- 
supostos simplificadores. Um deles foi que as variaveis explanatorias, ou regressores, eram fixas ou 
nao estocasticas ou, se estocasticas, eram independentes do termo de erro. Chamamos o primeiro caso 
de regressorfixo e o segundo de regressor aleatorio. 

No caso do regressorfixo, ja conhecemos as propriedades dos estimadores de MQO (veja os Capf- 
tulos 5 e 8). No caso do regressor aleatorio, se procedermos com o pressuposto de que nossa analise e 
condicional aos valores dados dos regressores, as propriedades dos estimadores de MQO que estuda- 
mos sob o caso do regressor fixo deverao ser validas. 

Se no caso do regressor aleatorio supusermos que esses regressores e o termo de erro sao distribuidos 
independentemente, os estimadores de MQO ainda serao nao tendenciosos, mas perderao a eficiencia. 55 

A situapao fica complicada quando o termo de erro nao e normalmente distribuido ou os regres¬ 
sores sao estocasticos ou ambos. Nesse caso, e dificil fazer qualquer afirmapao geral a respeito das 
propriedades de amostras finitas dos estimadores de MQO. Entretanto, sob certas condipoes, pode¬ 
mos invocar o teorema do limite central para estabelecer os estimadores de MQO de normalidade 
assintotica. Embora as demonstrapoes estejam alem do escopo deste livro, podem ser encontradas em 
outras fontes. 56 


52 Para uma discussao informal, veja MOONEY, Christopher Z.; DUVAL, Robert D. Bootstrapping: a nonparametric 
approach to statistical inference. Sage California: University Press, 1993. Para uma discussao formal, veja DAVIDSON, 
Russell; MACKINNON, James G. Econometric theory and methods. Nova York: Oxford University Press, 2004, 
p. 159-166. 

53 Lembre das hipoteses de Gauss-Markov, a saber, o valor esperado do termo de erro e zero, o termo de erro e 
cada uma das variaveis explanatorias sao independentes, a variancia do erro e homocedastica e nao ha auto- 
correlapao no termo de erro. Tambem se pressupoe que a matriz de variancia-covariancia das variaveis expla¬ 
natorias seja finita. Relaxamos a condipao de independence entre o termo de erro e os regressores e supomos 
a condipao mais fraca de que elas nao sao correlacionadas. 

54 A prova da normalidade assintotica dos estimadores MQO esta alem do escopo deste livro. Veja STOCK, James H.; 
WATSON, Mark W. Introduction to econometrics. 2. ed. Boston: Pearson/Addison Wesley, 2007. p. 710-711. 

55 Para detalhes tecnicos, veja GREENE, William H. Econometric analysis. 6. ed. Nova Jersey: Pearson/Prentice-Hall, 
2008. p. 49-50. 

56 Veja GREENE, op. cit. 
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13.13 Uma palavra ao pesquisador 

Este capitulo tratou de muitas questoes. Nao ha duvida de que a construgao de modelos seja uma 
arte e tambem uma ciencia. Um pesquisador pratico pode hear perplexo diante das sutilezas teoricas 
e de tantas ferramentas diagnosticas. Mas vale lembrar da advertencia de Martin Feldstein de que: “o 
profissional que lida com econometria aplicada, como o teorico, logo descobre pela experiencia que 
um modelo util nao e aquele ‘verdadeiro’ ou ‘realista’, mas aquele que e parcimonioso, plausfvel e 
informativo”. 57 

Peter Kennedy, da Simon Fraser University no Canada, defende os “dez mandamentos da econo¬ 
metria aplicada”: 58 

1. Usaras senso comum e a teoria economica. 

2. Deveras fazer as perguntas certas (colocar a relevancia a frente da elegancia matematica). 

3. Conheceras o contexto (nao realizaras analise estatistica sem conhecimento). 

4. Examinaras os dados. 

5. Nao adoraras a complexidade. Usaras o principio KISS, isto e, manteras tudo estocastica- 
mente simples (do ingles, keep it stochastically simple ). 

6 . Examinaras demoradamente e com rigor os resultados. 

7. Estaras atento aos custos de data mining. 

8 . Estaras disposto a conciliar (nao veneraras as prescribes dos manuais). 

9. Nao confundiras significancia com substantia (nao confundiras significancia estatistica com 
significancia pratica). 

10. Na presenga de questoes delicadas, faras tua confissao (deveras antecipar-se as criticas). 

Se desejar, o leitor podera ler o artigo de Kennedy para entender a convicgao que o leva a defender 
os dez mandamentos. Alguns deles podem parecer ironicos, mas ha certa verdade em cada um. 


Resuino e 
conclusoes 


1. O pressuposto do modelo classico de regressao linear de que o modelo econometrico usado na 
analise esta corretamente especificado tem dois sentidos. Um deles e que nao ha erros de especi- 
ficapao da cquayao e o segundo e que nao ha erros de especifica 9 ao do modelo. Neste capitulo, o 
foco principal foi nos erros de especificapao da cquaqao. 

2. Os erros de especificagao da equagao examinados neste capitulo foram: (1) omissao de uma 
ou mais variaveis importantes; (2) inclusao de uma variavel superflua; (3) adogao da forma 
funcional equivocada; (4) especificagao incorreta do termo de erro m,; e (5) erros de medida 
no regressando e regressores. 

3. Quando se omitem do modelo variaveis legitimas, as consequencias sao muito graves: os 
estimadores de MQO das variaveis mantidas no modelo nao apenas sao tendenciosos, mas 
tambem inconsistentes. Alem disso, as variancias e os erros padrao dessas variaveis sao 
calculados de forma incorreta, tornando ineficientes os procedimentos habituais de teste de 
hipoteses. 

4. As consequencias da inclusao de variaveis irrelevantes no modelo felizmente sao menos 
graves: os estimadores dos coeficientes de variaveis relevantes e tambem “irrelevantes” con¬ 
tinuant sendo nao tendenciosos e consistentes, e a variancia do erro o 1 2 3 4 continua sendo esti- 
mada corretamente. O unico problema e que as variancias estimadas tendem a ser maiores 


57 FELDSTEIN, Martin S. "Inflation, tax rules and investment: some econometric evidence." Econometrica, v. 30, 
1982. p. 829. 

58 KENNEDY, Peter, op. cit., p. 1 7-18. 
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EXERCICIOS 


que o necessario, resultando em estimativa menos exata dos parametros. Os intervalos de 
confianpa tendem a ser maiores que o necessario. 

5. Para detectarmos os erros de especificapao da equapao, consideramos varios testes, como (1) 
o exame dos residuos; (2) a estatistica de Durbin-Watson; (3) o teste RESET de Ramsey; e 
(4) o teste do multiplicador de Lagrange. 

6 . Um tipo especial de erro de especificapao refere-se a medipao dos valores do regressando 
e dos regressores. Se ha erros de medipao apenas no regressando, os estimadores de MQO 
continuam nao tendenciosos e consistentes, mas tornam-se menos eficientes. Se ha erros 
de medi 5 ao nos regressores, os estimadores de MQO passam a ser tendenciosos e incon- 
sistentes. 

7. Mesmo que se suspeite ou detecte erros de medi§ao, as solu 9 des nao costumam ser faceis. O 
uso de variaveis proxy ou instrumentais e teoricamente atraente, mas nem sempre e pratico. 
Por isso, e muito importante na pratica que o pesquisador seja cuidadoso quanto as fontes 
dos dados que emprega, como eles foram coletados, que definifoes foram usadas etc. Dados 
coletados por agencias oficiais com frequencia vem com varias notas de rodape e o pesqui¬ 
sador deve chamar a aten 9 ao do leitor para elas. 

8 . Os erros de especificapao do modelo podem ser tao serios quanto os de especificapao da equapao. 
Em particular, distinguimos entre modelos aninhados e nao aninhados. Para decidir quanto ao 
modelo adequado, discutimos o teste F nao aninhado, ou abrangente, o teste Leo teste J de 
Davidson-MacKinnon e apontamos as lrmita 5 oes de cada teste. 

9. A escolha de modelos empfricos em pesquisas praticas resulta em um variedade de criterios. 
Discutimos alguns deles, como os criterios de informapao de Akaike e de Schwarz, o criterio 
C p de Mallows e o criterio de previsao y 2 . Discutimos as vantagens e desvantagens desses 
criterios e tambem advertimos o leitor de que esses criterios nao sao absolutos, mas sim 
complementares a uma cuidadosa analise de especificapao. 

10. Tambem examinamos os seguintes topicos adicionais: (1) dados discrepantes, alavancagem 
e influencia; (2) minimos quadrados recursivos; e (3) teste de falhas de previsao de Chow. 
Abordamos o papel de cada um no trabalho aplicado. 

11. Discutimos rapidamente dois casos especiais: a nao normalidade do termo de erro estocasti- 
co e regressores aleatorios, e o papel da teoria de amostras grandes ou assintoticas em situa- 
poes em que as propriedades de amostras pequenas ou finitas dos estimadores de MQO nao 
podem ser estabelecidas. 

12. Conclulmos o capltulo apresentando os “dez mandamentos da econometria aplicada” de 
Peter Kennedy. Esses mandamentos tem por objetivo levar o pesquisador a ir alem dos 
aspectos puramente tecnicos da econometria. 


13.1. Retome a fun 9 ao de demanda para frangos estimada na Equa 9 ao (8.6.23). Considerando os atri- 
butos de um bom modelo discutido na Sepao 13.1, voce poderia dizer que essa fun 9 ao de deman¬ 
da esta especificada “corretamente”? 

13.2. Suponha que o modelo verdadeiro seja 

Yj = fiiXi + Ui (1) 

mas, em vez de se ajustar a essa regressao passando pela origem, ajustamos o modelo usual 
com o intercepto: 


Y, = a 0 + aiXj + Vi 


(2) 


Avalie as consequencias deste erro de especificapao. 
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13.3. Continue com o Exercicio 13.2, mas suponlia que o modelo (2) seja o verdadeiro. Discuta as 
consequencias de se ajustar o modelo (1) com erro de especificac^ao. 

13.4. Suponha que o modelo “verdadeiro” seja 

Y t = ft + P2X2 i + u, ( 1 ) 

mas que acrescentamos uma variavel “irrelevante” X 3 ao modelo (irrelevante no sentido de que 
o verdadeiro coeficiente ft ligado a variavel X 3 seja zero) e estimamos 

Yi = P 1 + P 2 X 21 + ftA 3 i + v t (2) 

a. S 2 eo R 2 ajustado para o modelo (2) seriam maiores que aqueles para o modelo (1)? 

b. As estimativas de ft e ft obtidas do modelo (2) sao nao tendenciosas? 

c. A inclusao da variavel “irrelevante” X 3 afetou as variancias de ft e ft? 

13.5. Considere a seguinte llrnpao de producfto (Cobb-Douglas) “verdadeira”: 

In Yj = a : 0 + a\ In ft, + a 2 lnZ, 2 i + «3 In K t + w,- 

em que Y — produ 5 ao 

L\ — mao de obra na produc^ao 
L 2 — mao de obra fora da produ§ao 
K — capital 

Mas suponha que a regressao usada na pesquisa aplicada seja 
In Yj — /1(| + ] In L u + /l 2 In K ! + Uj 

Supondo que tenham sido usados dados de corte transversal relaticos as variaveis relevantes, 

a. E(fi{) — Kj e E(P 2 ) — a 3 ? 

b. A resposta dada em (a) sera valida se soubermos que L 2 e um insumo irrelevante na fun 5 ao 
de produ 5 ao? Mostre as derivac:oes necessarias. 

13.6. Retome as Equa^Ses (13.3.4) e (13.3.5). Como se pode ver, a 2 , embora tendenciosa, tem uma 
variancia menor que /i 2 , que e nao tendenciosa. Qual seria sua decisao diante do trade-off e ,ntre 
tendenciosidade e variancia menor? 

Dica\ o EQM (erro quadratico medio) para os dois estimadores e expresso como 

EQM(a 2 ) = (v 2 /Yl, x ii) + Pi b 32 

= variancia amostral + quadrado do vies 
EQM (ft) = a 2 /j]x 2 2 ( 1 - r 2 3 ) 

Sobre o EQM, veja o Apendice A. 

13.7. Mostre que o /l estimado da Equayao (13.5.1) ou da (13.5.3) fornece uma estimativa nao tendencio¬ 
sa do verdadeiro ft. 

13.8. De acordo com a hipotese da renda permanente de Friedman, podemos escrever 

% = « + P*i (1) 

em que Y* = despesas de consumo “permanentes” e X* = renda “permanente”. Em vez de 
observarmos as variaveis “permanentes”, observamos 
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Yt = y; + Ui 

X, = X' + v, 


em que Y, e X, sao as quantidades que podem ser observadas ou medidas e m, e v, sao erros de 
medico em Y* e X*, respectivamente. 

Usando as quantidades observaveis, podemos escrever a fun£ao de consumo como 


Y = a + /3(Xi - v,) + Uj 
= a + /3Xj + (Uj - /3vj) 


( 2 ) 


Supondo que (1) £(m,) = £(v,) = 0, (2) var (u,) — o 2 u e var (v,) = a\, (3) cov (Y* u t ) = 0, cov 
(X*, vi) — 0, e (4) cov (, Uj, X*) = cov (v„ Y*) = cov (m,-, V,-) = 0, mostre que em grandes amostras 
o P estimado da Equa?ao (2) pode ser expresso como 


a. O que voce pode dizer sobre a natureza do vies em /T? 

b. Se o tamanho da amostra aumentar indefinidamente, o /3 estimado tendera a igualar-se ao 
verdadeiro /3? 

13.9. Modelo de formagdo de pregos de ativos com risco. O modelo de formac^ao de pre 50 s de ativos 
com risco (CAPM) da moderna teoria do investimento postula a seguinte rclagao entre a taxa 
media de retorno de um titulo (ac:ao), medida em determinado periodo, e a volatilidade do tl- 
tulo, chamada de coeficiente beta (a volatilidade como medida de risco): 


Ri = «i + a 2 (Pi) + Uj 


( 1 ) 


em que R : — taxa media de retorno do titulo i 

Pi = verdadeiro coeficiente beta do titulo i 
iij — termo de erro estocastico 


O verdadeiro p, nao e diretamente observavel, mas e medido como se segue: 


ru -a i + p*r mt + e t 


( 2 ) 


em que r„ = taxa de retorno do titulo i para o periodo t 

r mt — taxa de retorno de mercado para o periodo 1 (esta e a taxa de retorno para algum indi¬ 


ce de mercado amplo, como o indice S&P para titulos de empresas industrials) 


e, — termo residual 

e p* e uma estimativa do “verdadeiro” coeficiente beta. Na pratica, em vez de estimar a Equa- 
?ao (1), estima-se 


Ri = ai+ a 2 (P *) + Uj 


(3) 


em que P* sao obtidos da regressao (2). Mas, uma vez que os p* sao estimados, a rela§ao entre 
o verdadeiro p e p* pode ser escrita como 



( 4 ) 


em que v, pode ser chamado erro de medida. 
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a. Qual sera o efeito desse erro de medida na estimativa de a 2 ? 

b. O o '2 estimado da Equagao (3) fornece uma estimativa nao tendenciosa do verdadeiro a{l 
Se nao fornecer, sera uma estimativa consistente de a{! Se nao for, que medidas corretivas 
voce sugere? 

13.10. Considere o modelo 

Y, = Pi + P 2 X 2i + Uj (1) 

Para descobrir se o modelo tem erro de especificagao por omitir a variavel X 3 do modelo, 
voce decide regredir os resfduos obtidos do modelo (1) somente na variavel X 3 . ( Nota : ha 
um intercepto nesta regressao.) O teste do multiplicador de Lagrange (ML), no entanto, 
exige que se efetue a regressao dos residuos do modelo (1) contra X 2 e X 3 e uma constante. 
Por que e provavel que este procedimento seja inadequado?* * 

13.11. Considere o modelo 

Yi= Pi + P 2 X t + ut 

Na pratica medimos X \por X t tal que 

a. X i = X*+5 

b. X t = 3X* 

c. Xj = {X* + e,), em que e, e um termo puramente aleatorio com as propriedade usuais 
Qual sera o efeito desses erros de medida sobre a estimativa dos verdadeiros p\ e p 2 l 

13.12. Retorne as Equagoes (13.3.1) e (13.3.2). De uma maneira semelhante a Equagao (13.3.3) 
mostre que 

E{a 0 = Pi + p 3 (Xi - b 22 X 2 ) 

em que b 22 e o coeficiente angular na regressao da variavel omitida X 2 contra a variavel 
inclulda X 2 . 

13.13. Avalie criticamente a seguinte opiniao de Leamer:f 

Meu interesse em metaestatfstica [a teoria da inferencia que decorre realmente dos dados] vem de 
minhas observagoes do trabalho dos economistas. A opiniao de que a teoria econometrica e irrele- 
vante e mantida pela maioria dos economistas. E esperado que a ampla lacuna entre a teoria e a 
pratica econometrica cause tensao nos profissionais. De fato, um equilibrio penneia nossos encon- 
tros [profissionais] e publicagoes. Estamos tranquilamente divididos entre um clero celibatario de 
estatfsticos teoricos, de um lado, e uma legiao de analistas de dados, pecadores inveterados, de ou- 
tro. Os padres tem o poder de dizer o que e pecado e sao reverenciados por seus dons. Nao se espe- 
ra que os pecadores evitem pecar; eles so precisam confessar francamente seus erros. 

13.14. Avalie a seguinte afirmagao de Henry TheihJ 

Dados os conhecimentos atuais, o procedimento mais sensato e fazer uma interpretagao nao rigo- 
rosa dos coeficientes de confianga e dos limites de significancia quando se calculam intervalos de 
confianga e testes estatisticos por meio da regressao final da forma convencional. Isto e, um coe¬ 
ficiente de confianga de 95% pode, na verdade, ser um coeficiente de 80% e um nivel de signifi¬ 
cancia de 1% pode ser um nivel de 10%. 


Veja MADDALA, op. cit., p. 477. 

t LEAMER, Edward E. Specification searches: Ad Hoc Inference with Nonexperimental Data. Nova York: John Wiley 
& Sons, 1978. p. vi. 

* THEIL, Henry. Principles of econometrics. Nova York: John Wiley & Sons, 1971. p. 605-606. 
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13.15. Comentando os metodos econometricos praticados na decada de 1950 e infcio dos anos 
1960, Blaug afirmou: 

[. . .] grande parte dela [da pesquisa aplicada] e como jogar tenis com a rede abaixada: em lugar de 
tentar refutar as provisoes comprovaveis, os economistas modemos ficam, muito frequentemente, sa- 
tisfeitos em demonstrar que o mundo real confonna-se as suas previsdes, substituindo, assim, a falsifi- 
cagao [a la Popper], o que e dificil, pela facil verificagao. 

Voce concorda com essa opiniao? Pode ser interessante consultar o livro de Blaug para en- 
tender melhor a visao dele. 

13.16. De acordo com Blaug, “nao existe uma logica da comprovagao, mas sim da refutagao”.** 
O que ele quis dizer com isso? 

13.17. Consulte o modelo de St. Louis discutido no texto. Lembrando dos problemas associados 
ao teste F aninhado, avalie criticamente os resultados apresentados na regressao (13.8.4). 

13.18. Suponha que o verdadeiro modelo seja 

Y; = Pi + faXi + p 3 Xf + faX] + 11 ,- 

mas que se tenha estimado 

Yi = a\ + a 2 Xj + Vi 

Se forem usadas as observagoes de Y em X — —3, —2, —1, 0, 1, 2, 3, e estimado o modelo 
“incorreto”, que vies resultara nessas estimativas?f 

13.19. Para ver se a variavel Vfpertence ao modelo 1) = /!, + P 2 X, + «„ o teste RESET de Ramsey 
estimaria o modelo linear, obtendo os valores estimados de Y t com base neste modelo 
[Yi — P\ + P 2 X,] e entao estimaria o modelo Y t — u.\ + a 2 Xi + a 3 Yj + v ; e testaria a signi- 
ficancia de a 3 . Demonstre que, se a 3 for estatisticamente significativo na equa 5 ao an¬ 
terior (RESET), isto seria equivalente a estimar o seguinte modelo diretamente: 
Y = P i + p 2 X t + p 3 Xj + Uj. (Dica: Substitua por Yj na regressao RESET.)* * 

13.20. Indique se estas afirmapoes sao verdadeiras ou talsas.-' 

a. Uma observapao pode ser influente sem constituir um dado discrepante. 

b. Uma observapao pode ser um dado discrepante sem ser influente. 

c. Uma observapao pode ser tanto um dado discrepante quanto influente. 

d. Se no modelo Y t = P\+ p 2 Xi + p 3 Xf + u,p 2 for estatisticamente significativo, deve- 
mos reter o termo linear X t mesmo que p 2 seja estatisticamente insignificante. 

e. Se estimarmos o modelo Y t = P\ + P 2 X 2i + P 3 X 3i + u t ou Y i = a l + P 2 x 2i + PyKy + 
por MQO, a linha de regressao estimada sera a mesma, em que x 2i — 
{X 2 i - X 2 ) e x 3i = (X 3i - X 3 ). 

Exercfcios aplicados 

13.21. Use os dados do Exercicio 7.19 relativos a demanda de frangos. Suponha que lhe digam que 
a verdadeira fungao de demanda e: 


In Y t — P\ + p 2 lnX 2t + p 3 \nX 3t + P(, InX^ + u t 


0 ) 


BLAUG, M. The methodology of economics. Or how economists explain. Nova York: Cambridge University Press, 
1980. p. 256. 

” Ibid., p. 14. 

t Adaptado de SEBEIR, G. A. F. Linear regression analysis. Nova York: John Wiley & Sons, 1977. p. 1 76. 

* Adaptado de Peterson, Kerry, op. cit., p. 184-185. 

5 Adaptado de DRAPER, Norman R.; SMITH, Harry, op. cit., p. 606-607. 
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mas voce discorda e calcula a seguinte fun 9 ao de demanda: 


In Y t = oi\ + a 2 lnX 2i + a 3 \r\X^ t + v t 


( 2 ) 


em que Y = consumo per capita de frango (libras-peso) 

X 2 — renda real disponfvel per capita 
X 2 — preijo do frango no varejo 

X 6 — preco real composto de carnes que substituem o frango 

a. Efetue os testes RESET e ML de erros de cspccificaqao, supondo que a fun?ao de de¬ 
manda ( 1 ) dada seja a verdadeira. 

b. Suponha que (%, na F.quaqao (1) seja estatisticamente insignificante. Isso indica que nao 
ha erro de especificapao se ajustarmos a Equa 9 ao ( 2 ) aos dados? 

c. Se yS 6 for insignificante, isso indica que nao deveriamos introduzir o pre 90 de um ou 
mais produtos substitutos como argumento na fun 9 ao de demanda? 

13.22. Continue o Exercicio 13.21. Estritamente para fins pedagogicos, suponha que o modelo (2) 

seja a verdadeira fun 9 ao de demanda. 

a. Se agora estimarmos o modelo (1), que tipo de erro de especifica 9 ao sera cometido nes- 
te caso? 

b. Quais as consequencias teoricas desse erro de especifica 9 ao? Ilustre com os dados dis- 
ponfveis. 

13.23. O modelo verdadeira e 


Y* = fa + foX* + u j (1) 

mas, devido aos erros de medida estimados, 

Yj = ci\ + a 2 Xi + v t (2) 


em que Y t = Y j + e ; e X t =X* + w,-, em que £,■ e w ,• sao erros de medida. 

Usando os dados da Tabela 13.2, documente as consequencias de estimar o modelo (2) em 
vez de o modelo verdadeira ( 1 ). 

13.24. Experimento de Monte Carlo. Dez indivfduos tinham as seguintes rendas semanais perma- 
nentes: $ 200, 220, 240, 260, 280, 300, 320, 340, 380 e 400. O consumo permanente ( Y*) 
estava relacionado com a renda permanente X j como 

Y* = 0.82T* (1) 

Cada um desses indivfduos tinha renda transitoria igual a 100 vezes um numero aleatorio m ; 
tirado de uma popula 9 ao normal com media = 0 e a 2 — 1 (isto e, variavel normal padrao). 
Suponha que nao haja componente transitorio no consumo. O consumo medido e o consu¬ 
mo permanente sao iguais. 

a. Extraia 10 numeros aleatorios de uma populapao normal com media zero e variancia 
unitaria e obtenha 10 numeros para a renda medida X, ( = X* + 100w,j. 

b. Estime a regressao do consumo permanente (= observado) contra a renda observada 
usando os dados obtidos em (a) e compare seus resultados com os da Equa 9 ao (1). A 
priori, o intercepto deveria ser zero (por que?). E esse o caso? Por que? 

c. Repita (a) 100 vezes e obtenha 100 regressoes como mostrado em (b) e compare seus 
resultados com a verdadeira regressao (1). Que conclusoes gerais voce tira? 


Adaptado de DOUGHERTY, Christopher. Introduction to econometrics. Nova York: Oxford University Press, 1992, 
p. 253-256. 
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13.25. Retome o Exercicio 8.26. Com as definifoes das variaveis dadas la, considere os seguin- 
tes modelos para explicar Y: 

Modelo A: Y t = a i + + 013 X 4 / + 014 X 6 / + u t 

Modelo B: Y t = ft\ + ftiXit + P 3 X 5 / + @ 4 X 5 / + u t 

Usando o teste F aninhado, como voce escolheria entre os dois modelos? 

13.26. Continue com o Exercicio 13.25. Usando o teste J, como voce decidiria entre os dois mo¬ 
delos? 

13.27. Retome ao Exercicio 7.19, relacionado a demanda de frango nos Estados Unidos. Nele fo- 
ram apresentados cinco modelos. 

a. Qual a diferen^a entre o modelo 1 e o modelo 2? Se o modelo 2 estiver correto e voce estimar 
o modelo 1, que tipo de erro cometera? Que teste aplicaria: a equa^ao de erro de especificapao 
ou o erro de sele 9 ao de modelo? Mostre os calculos necessarios. 

b. Entre os modelos 1 e 5, qual voce escolheria? Que testes usaria e por que? 

13.28. Retorne a Tabela 8.11, que apresenta os dados sobre poupan^a pessoal ( Y) e renda pessoal 
disponfvel (A) para o periodo de 1970-2005. Agora considere os seguintes modelos: 

Modelo A: Y t = a\ + 0 L 3 X t + 0 ( 3 X t \ + u t 
Modelo B: Y t = ft\ + ft 2 X/ + ft 2 Y/-\ + u t 

Como voce faria a escolha entre esses dois modelos? Descreva com clareza os procedimen- 
tos de teste a serem usados e mostre todos os calculos. Suponha que alguem afirme que a 
variavel taxa de juros perten 9 a a fun 9 ao de poupan 9 a. Como voce testaria isso? Fa 9 a coleta 
dos dados de Letras do Tesouro durante tres meses como um proxy para os juros e apresen- 
te a demonstra 9 ao de sua resposta. 

13.29. Use os dados do Exercicio 13.28. Para familiarizar-se com os minimos quadrados recursi- 
vos, estime a fun 9 ao de poupan 9 a para 1970-1981, 1970-1985, 1970-1990 e 1970-1995. 
Comente sobre a estabilidade dos coeficientes estimados nas Husoes de poupan 9 a. 

13.30. Continue com o Exercicio 13.29, mas agora use os dados atualizados na Tabela 8.10. 

a. Suponha que voce fa 9 a uma estimativa da fun 9 ao de poupan 9 a para 1970-1981. Usando os 
parametros estimados e os dados da renda pessoal disponfvel de 1982-2000, calcule a pou- 
panga prevista para o ultimo periodo e use o teste de falha de previsao para descobrir se ele 
rejeita a hipotese de que a funcfio de poupanca entre os dois periodos de tempo nao mudou. 

b. Agora estime a fun 9 ao de poupan 9 a para os dados de 2000-2005. Compare os resultados 
da fun 9 ao para o periodo 1982-2000 usando o mesmo metodo (teste de falhas de previsao 
de Chow). Ha mudan 9 a significativa na fun 9 ao de poupan 9 a entre os dois periodos? 

13.31. Omissao de uma variavel no modelo de regressao com k variaveis. Consulte a Equa 9 ao 
(13.3.3), que mostra o vies na omissao da variavel A 3 do modelo Y/ — ft f + ft 2 X 2 ,■ + $ 3 X 3 / + m ; . 
Isso pode ser generalizado como se segue: no modelo de k variaveis Y/= ft y + ft 2 X 2l : + ..., 
+ PkXki + M;, suponha que a variavel X k seja omitida. Entao, pode-se demonstrar que o vies 
decorrente da omissao da variavel no coeficiente angular da variavel incluida Xj e: 

E(ftj) = ftj+ ftkhj j = 2 , 3, ...,(& - 1 ) 

em que b k j e o coeficiente angular (parcial) de Xj na regressao auxiliar da variavel excluida 
X k em todas as variaveis explanatorias incluidas no modelo. 

Retome o Exercicio 13.21. Descubra o vies dos coeficientes na Equa 9 ao (1) se excluirmos 
a variavel In X 6 do modelo. Essa exclusao e grave? Mostre os calculos necessarios. 


Isso pode ser generalizado para o caso em que mais de uma variavel reievante X seja excluida do modelo. Sobre 
isso, veja MUKHERJEE, Chandan et al., op. cit., p. 215. 
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Apendice 1 3A 


13A.1 A prova de que £(b 12 ) — P 2 + 

Na forma de desvio, o modelo de regressao populacional com tres variaveis pode ser escrito como 

yi = ft *2 i + ft *3/ + (Ui - u) 

Primeiro multiplicando por x 2 e entao por x 3 , as equagoes normals usuais sao 

Y y ‘ XZi = ft ^4 + ft YxxXjj + Y, X2i ( Ui ~ “) 

Y, y ’ x 3 > = ft Y x2 ‘ x i> + ft y^4 + Y x n( u i ~ “) 

Dividindo a Equagao (2) por *1; em ambos os lados, obtemos 

£.Vi*2i „ , „ 'E x 2iX3i £*2 i(Ui~u) 

-2“ = ft + ft ■ . ■, + - 


£4 


Agora, relembrando que 


ft 2 - 


£4 

E.Vi*2; 

£4 

£ X2 i X’ii 


£4 


A Equagao (4) pode ser escrita como 

ft 2 = ft + ft ft 2 + 


£4 

£x2iO, - i<) 


£4 

Tomando o valor esperado da Equagao (5) em ambos os lados, obtemos 

E(b\ 2 ) = ft + ft ft 2 


( 1 ) 

( 2 ) 

(3) 

(4) 


(5) 


( 6 ) 


em que usamos os fatos de que (a) para uma dada amostra, ft 2 e uma quantidade conhecida, fixa, ( b ) ft e ft sao 
constantes e (c) m, nao esta correlacionado com X 2i (nem com X 3i ). 

13A.2 Consequencias de incluir uma variavel irrelevante: 
a propriedade de nao tendenciosidade 


Para o verdadeiro modelo (13.3.6), temos 


ft 


£ yx 2 

£4 


e sabemos que ele nao e tendencioso. 
Para o modelo (13.3.7), obtemos 


a 2 


(E>'*2)(£4)- (£^ 3 )(£^ 3 ) 

£4 £4- (£^x 3 ) 


(i) 


( 2 ) 


37 = ft *2 + (Ui - u) 


( 3 ) 
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Substituindo y, do modelo (3) no modelo (2) e simplificando, obtemos 

E x iE x i - (E x 2 x ?) 
e(& 2 ) = h - ) -^ 

E 4 E 4 - (E^s) 


= P 2 

isto e, &2 permanece nao tendencioso. Tambem obtemos 

(E(E 'i - (Ei^VE^s) 

as = — -—------- 

E X fE X f~ (E x 2 x s) 

Substituindo y t do modelo (3) no modelo (5) e simplificando, obtemos 


Em __ -(£«*>)Ql)] 

E x iE x f- (E^2X 3 ) 2 

= 0 

que e seu valor no modelo verdadeiro ja que Z 3 esta ausente do modelo verdadeiro. 


13A.3 A prova da equa^ao (13.5.10) 


( 4 ) 


(5) 


( 6 ) 


Temos 

0 ) 
( 2 ) 


Y — ot + PX^ + Ui 
Xi = X- + Wj 


Portanto, na forma de desvio, temos 

Yi = fix* + (ui- u) 

Xi = x t + (w, - w) 


Agora, quando usamos 


Yj = a + fiX t + Ui 


(3) 

(4) 

(5) 


obtemos 


P = 


Ey x 

E x2 


Y\P X + (“ ~ »)][ x * + iyv-w)] 

Et x * + (w-w)] 2 


usando (3) e (4) 


/6 E x * 2 + P E x *( w _ w) + E x *( m ~ u) + E( w “ u){w - w ) 

5^x* 2 + 2 J2x'(w - w) + E(w - w) 2 

Como nao podemos subtrair as expectativas dessa expressao, pois a expectativa da razao entre duas variaveis 
nao e igual a razao de suas expectativas ( Nota: o operador de expectativas E e linear), primeiro dividimos cada 
termo do numerador e do denominador por n e tomamos o limite de probabilidade, plim (veja o Apendice A 
para detalhes do plim), de 


(1 /«) \PE X ' 2 + P E x *( w - W) + E**(» - u) + E(« - «0(w - w)] 
(1 /») [E x * 2 + 2J2 x '(w - w) + E(w - w) 1 ] 
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Agora, o limite de probabilidade da razao de duas variaveis e a razao de seus limites de probabilidade. 
Aplicando essa regra e tomando o plim de cada termo, obtemos 


em que a\* e a\, sao variancias de X* e de w quando o tamanho da amostra aumenta indefinidamente e usamos 
o fato de que enquanto o tamanho da amostra aumenta indefinidamente nao ha correla<;ao entre os erros u ew, 
bem corno entre eles e o verdadeiro X*. Da expressao anterior, obtemos 


plim p = y6 



que e o resultado exigido. 


13A.4 A prova da equa^ao (13.6.2) 


Uma vez que nao ha intercepto no modelo, a estimativa de a , de acordo com a formula da regressao que 
passa pela origem, e a seguinte: 


Substituindo Y do modelo verdadeiro (13.2.8), obtemos 


A teoria estatfstica mostra que In m,- ~ JV(0, o 2 ) entao 


u / ~ lognormal ^e al ^ 2 , e a ~ (e a ~ 


(3) 


Portanto, 





em que se usa o fato de que os X sao nao estocasticos e cada u t tern um valor esperado de e a2/2 . 
Como E(a) /3, a e um estimador tendencioso de p. 
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Na Parte 1 introduzimos o modelo classico de regressao linear com todas as suas hipoteses. Na 
Parte 2 examinamos detalhadamente as consequencias que se seguem quando uma ou mais dessas 
hipoteses nao sao satisfeitas e o que pode ser feito nessa situagao. Na Parte 3, estudaremos algumas 
tecnicas econometricas selecionadas e bastante aplicadas. Examinaremos principalmente os seguintes 
topicos: (1) modelos de regressao nao linear nos parametros; (2) modelos de regressao de resposta 
qualitativa; (3) modelos de regressao com dados em painel; e (4) modelos econometricos dinamicos. 

No Capitulo 14, veremos modelos intrinsecamente nao lineares nos parametros. Com a grande 
disponibilidade de programas especializados, nao ha mais dificuldade para estimar esses modelos. 
Embora os calculos matematicos possam assustar alguns leitores, as ideias basicas dos modelos de 
regressao nao linear nos parametros podem ser explicadas intuitivamente. Este capitulo mostra, com 
auxilio de exemplos adequados, como esses modelos podem ser estimados e interpretados. 

No Capitulo 15, trataremos de modelos de regressao cuja variavel dependente e de natureza qua¬ 
litativa. Esse capitulo complementa, portanto, o Capitulo 9, em que examinamos os modelos em que 
as variaveis explanatorias eram de natureza qualitativa. O objetivo basico do Capitulo 15 e a formu- 
lagao de modelos em que o regressando e do tipo sim ou nao. Como os MQO impoem varios proble- 
mas a estimativa de tais modelos, foram elaboradas diversas alternativas. Aqui trataremos de duas 
delas: os modelos logit e probit. Tambem examinaremos diversas variantes dos modelos de escolha 
qualitativa como o modelo Tobit e o modelo de regressao de Poisson. Discutiremos ainda, breve- 
mente, algumas extensoes de tais modelos como o probit ordenado, o logit ordenado e o logit 
multinomial. 

No Capitulo 16, discutiremos os modelos de regressao com dados em painel. Estes combinam 
observagoes de series temporais e de corte transversal. Embora, ao combinarmos essas observagoes, 
aumentemos o tamanho da amostra, os modelos de regressao langam varios desafios para sua estima- 
gao. No Capitulo 16, examinaremos apenas os aspectos essenciais e daremos orientagoes para os 
leitores aprofundarem esse estudo. 

No Capitulo 17, trataremos dos modelos de regressao que incluem valores atuais e passados, ou 
defasados, das variaveis explanatorias, bem como os que incluem um ou mais valores defasados da 
variavel dependente como uma das variaveis explanatorias. Estes sao denominados, respectivamente, 
modelos com defasagens distribuidas e modelos autorregressivos. Embora sejam extremamente 
uteis na econometria empirica, apresentam alguns problemas de estimagao especiais por nao segui- 
rem uma ou mais das hipoteses do modelo classico de regressao. Consideramos esses problemas no 
contexto dos modelos de Koyck, de expectativas adaptativas (EA) e de ajustamento parcial. Tambem 
destacaremos as criticas feitas ao modelo EA pelos defensores da chamada escola das expectativas 
racionais (ER). 



14 

Modelos de regressao 
nao linear 


A principal enfase deste livro e nos modelos de regressao linear, ou seja, modelos com parametros 
lineares e/ou que possam ser transformados de modo que tenham parametros lineares. No entanto, em 
certas ocasioes, as razoes teoricas ou empiricas levam-nos a considerar modelos nao lineares nos 
parametros. 1 Neste capitulo, veremos esses modelos e suas caracterfsticas especiais. 


14.1 Modelos de regressao intrinsecamente linear e nao linear 

Quando come 9 amos nossa discussao de modelos de regressao linear no Capitulo 2, afirmamos 
que neste livro nos ocuparfamos basicamente dos modelos de regressao linear nos parametros, poden- 
do ter ou nao variaveis nao lineares. Se voltarmos a Tabela 2.3, veremos que um modelo que e linear 
nos parametros e nas variaveis e de regressao linear, do mesmo modo que um modelo linear nos pa¬ 
rametros, mas nao nas variaveis. Por outro lado, se o modelo e nao linear nos parametros, ele sera de 
regressao nao linear (nos parametros), mesmo se as variaveis forem lineares ou nao. 

Porem, e preciso estar atento, pois alguns modelos podem parecer nao lineares nos parametros, 
mas sao inerente ou intrinsecamente lineares, porque, com as devidas transforma 5 oes, podem tor- 
nar-se modelos de regressao linear nos parametros. Mas, se eles nao puderem ser linearizados nos 
parametros, serao denominados modelos de regressao intrinsecamente nao linear. De agora em 
diante, aofalar de modelos de regressao nao linear, estaremos considerando que sejam modelos de 
regressao intrinsecamente nao linear. Nos os chamaremos de MRINL. 

Para deixar bem clara a distinc/ao entre os dois, retomaremos os Exercicios 2.6 e 2.7. No primeiro 
deles, os modelos a, b e c sao de regressao linear, porque ele sao todos lineares nos parametros. O 
modelo d e uma mistura, pois e linear, mas In ( J >\ nao e. Mas, se fazemos a. = In/3], entao esse 
modelo e linear em a e /3 2 . 

No Exercicio 2.7, os modelos dee sao de regressao intrinsecamente nao linear, pois nao ha uma 
maneira simples de torna-los lineares. O modelo c e obviamente o de uma regressao linear. Mas e os 
modelos a e b? Tirando os logaritmos dos dois lados de a, obtemos In Y, = fi x + /3 2 X t + u h que e 
linear nos parametros. Portanto, o modelo a e um modelo de regressao intrinsecamente linear. O 
modelo b e um exemplo da funcao de distribuicao (de probabilidade) logistica e sera estudado no 
Capitulo 15. Aparentemente, trata-se de um modelo de regressao nao linear, mas um simples artiffcio 
matematico consegue transforma-lo em um modelo de regressao linear, a saber: 


1 Observamos, no Capitulo 4, que, sob a premissa de normalidade do termo de erro, os estimadores de MQO nao 
sao apenas os melhores estimadores lineares nao tendenciosos (MELNT), mas tambem os melhores estimadores 
nao tendenciosos em toda a classe de estimadores, lineares ou nao. Mas, se nao seguirmos a premissa da nor¬ 
malidade, e possivel, como ressaltam Davidson e McKinnon, obter estimadores nao lineares e/ou tendenciosos 
que podem ter melhor desempenho que os estimadores de MQO. Veja DAVIDSON, Russell; MACKINNON, Ja¬ 
mes C. Estimation and inference in econometrics. Nova York: Oxford University Press, 1993. p. 161. 
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= ft + p 2 Xi + u, (14.1.1) 

Portanto, o Modelo b e intrinsecamente linear. Veremos a utilidade de modelos como a Equagao 
(14.1.1) no proximo capitulo. 

Agora, considere a fungao de produgao Cobb-Douglas (C-D). Sendo Y — produgao, X 2 — insu¬ 
mo trabalho e X 3 — insumo capital, escreveremos esta fungao de tres maneiras diferentes: 

Yi=0iX (14.1.2) 
ou 

In Y/ = a + ft In X 2 , + ft In X 3l + w, (14.1. 2d) 

em que a — In ft. Assim, neste formato, a fungao, C-D e intrinsecamente linear. 

Agora, considere esta versao da fungao C-D: 

Y i =faX%X§u i (14.1.3) 



ou 


In Yj = a + ft In X 2l + /S 3 In A 3 , + In Uj 


(14.1.3o) 


em que a — In Este modelo tambem e linear nos parametros. 

Mas agora considere a seguinte versao da fungao C-D: 

Y t = + Ui (14.1.4) 

Como notamos, as versoes C-D (14.1.2a) e (14.1.3a) sao modelos de regressao intrinsecamente linear 
(nos parametros), mas nao ha como transformar a Equagao (14.1.4) de modo que o modelo transfor- 
mado possa tornar-se linear nos parametros . 2 Portanto, a Equagao (14.1.4) e, intrinsecamente, um 
modelo de regressao nao linear. 

Outra fungao conhecida, mas intrinsecamente nao linear, e a fungao de produgao com elasticidade 
de substituigao constante (CES), sendo a fungao Cobb-Douglas um caso especial. A fungao CES 
tem a seguinte forma: 

Y, = 4sk; p + (1 - &)L-/Y l ' P (14.1.5) 

em que Y — produgao, K = insumo capital, L — insumo trabalho, A = parametro de escala, S — parametro 
de distribuigao (0 < 8 < 1), ft — parametro de substituigao ( ft > — l ). 3 Nao importa de que forma o 
termo de erro estocastico m, e inclui'do nesta fungao de produgao, nao ha como torna-la um modelo de 
regressao linear (nos parametros); e intrinsecamente um modelo de regressao nao linear. 


14.2 Estima^ao dos modelos de regressao linear e nao linear 

Para entender a diferenga entre a estimagao dos modelos de regressao linear e nao linear, consi¬ 
dere os seguintes modelos: 

Y, = p x + fcXt + Ui (14.2.1) 

Y, = Pxe hX ' + u t (14.2.2) 


2 Se tentarmos transformar o modelo em logaritmo, ele nao funcionara, porque In (A + 6) # In A + In 6. 

3 Para propriedades da fungao de produgao CES, veja INTRILIGATOR, Michael D.; BODKIN, Ronald; HSIAO, 
Cheng. Econometric models, techniques, and applications. 2. ed. Prentice Hall, 1996. p. 294-295. 
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A esta altura sabemos que a Equagao (14.2.1) e um modelo de regressao linear, enquanto a Equa¬ 
gao (14.2.2) e nao linear. A regressao (14.2.2) e conhecida como modelo de regressao exponencial, 
sendo muitas vezes empregada para medir o crescimento de uma variavel, como a populagao, o PIB 
ou a oferta de moeda. 

Suponha que desejemos estimar os parametros desses dois modelos pelos minimos quadrados 
ordinarios. Os MQO minimizarao a soma dos quadrados dos residuos (SQR) que, no caso do modelo 
(14.2.1), e: 

22 = 22 ^-^- < 14 - 2 - 3 ) 

em que, como de costume, ft\ e ft 2 sao os estimadores de MQO dos verdadeiros ft. Diferenciando a 
expressao anterior em relagao as duas incognitas, obtemos as equagoes normals apresentadas nas 
Equagoes (3.1.4) e (3.1.5). Resolvendo as equagoes simultaneamente, obteremos os estimadores de 
MQO dados nas Equagoes (3.1.6) e (3.1.7). Observe atentamente que, nessas equagoes, as incognitas 
(ft) estao do lado esquerdo e os valores conhecidos (X e Y), do lado direito. Como resultado, obtemos 
as solugoes explicitas para os dois termos. 

Agora vejamos o que acontece se tentarmos minimizar as SQR da Equagao (14.2.2). Como e 
apresentado no Apendice 14A, Segao 14A. 1, as equagoes normais que correspondem as Equagoes 
(3.1.4) e (3.1.5) sao as seguintes: 

J2 Yie hx ‘ = ftie 2hXt (14.2.4) 

22 Y.X.e^- = ft x 22 X ' e ^ lX ‘ (14.2.5) 

Ao contrario das equagoes normais do modelo de regressao linear, as do modelo nao linear apre- 
sentam incognitas (os ft) dos dois lados das equagoes. Em consequencia, naopodemos obter solugoes 
explicitas para as incognitas com base nos valores conhecidos. Em outras palavras, as incognitas es¬ 
tao expressas em termos delas mesmas e dos dados. Embora possamos aplicar o metodo dos minimos 
quadrados para estimar os parametros dos modelos de regressao nao linear, nao podemos obter solu¬ 
goes explicitas para as incognitas. Devemos mencionar que os MQO aplicados aos modelos de re¬ 
gressao nao linear sao conhecidos como minimos quadrados nao lineares (MQNL). E agora, qual 
a solugao? E o que veremos a seguir. 


14.3 Estima^ao de modelos de regressao nao linear: 
o metodo da tentativa e erro 


Para comegarmos, vejamos um exemplo concreto. Os dados da Tabela 14.1 relacionam as taxas 
de administragao que um importante fundo mutuo dos Estados Unidos paga a seus agentes de inves- 
timentos pela gestao dos ativos. Essas taxas dependem do valor liquido dos ativos do fundo. Como se 
ve, quanto mais elevado o valor liquido dos ativos do fundo, menores sao as taxas de administragao, 
de acordo com a Figura 14.1. 

Para entendermos como o modelo de regressao exponencial na Equagao (14.2.2) ajusta os dados 
da tabela 14.1, podemos prosseguir por meio de tentativa e erro. Imagine que inicialmente fagamos 
fti — 0,45 e ft 2 = 0,01. Esses valores sao puros palpites, as vezes com base em experiencia anterior 
ou em trabalho empfrico anterior ou obtidos pelo ajustamento de um modelo de regressao linear, 
embora ele possa nao ser adequado. Neste estagio, nao precisamos bear preocupados com a maneira 
como os dados foram obtidos. 

Como conhecemos os valores de ft l e ft 2 , podemos escrever a Equagao (14.2.2) como: 

Uj = Y, - ft x e hX ' = Y, - 0,45e aolXi 


( 14 . 3 . 1 ) 
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TABELA 14.1 

Taxas de assessoria 
cobradas e montante 
dos ativos 



Taxa (%) 

Ativo* 

1 

0,520 

0,5 

2 

0,508 

5,0 

3 

0,484 

10 

4 

0,46 

15 

5 

0,4398 

20 

6 

0,4238 

25 

7 

0,4115 

30 

8 

0,402 

35 

9 

0,3944 

40 

10 

0,388 

45 

11 

0,3825 

55 

12 

0,3738 

60 


* Ativo representa o valor lfquido do ativo, em bilhoes de dolares. 


FIGURA 14.1 

Relagao de taxas de 
assessoria e os ativos 
de fundo. 
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Portanto, 

E u ‘ = E( F ‘ - 0 ’ 45e °' 01Xi ) 2 (14.3.2) 

Como Y, X, ySj e p 2 sao conhecidos, podemos encontrar facilmente a soma dos quadrados 
dos erros na Equagao (14.3.2). 4 Lembre-se de que, nos MQO, nosso objetivo e encontrar os valores dos 
parametros desconhecidos que tomam a soma dos quadrados dos resfduos a menor possfvel. Isso 
acontecera se os valores estimados de Y do modelo forem o mais proximos possfvel dos valores 
observados de Y. Com os valores dados, obtemos iq = 0,3044. Mas como sabemos que obtivemos 
a menor soma possfvel dos erros que podemos obter? O que acontece se escolhermos outro valor para 
Pi e p 2 , por exemplo, 0,50 e -0,01, respectivamente? Repetindo o procedimento que acabamos de 
expor, verificamos que agora obtemos 11 1 ~ 0,0073. Obviamente, essa soma dos quadrados dos 
erros e muito menor que a obtida anteriormente, igual a 0,3044. Mas como sabemos que conseguimos 
a menor soma dos quadrados dos erros possfvel, se ao escolhermos outro conjunto de valores para os 
P, obteremos ainda outra soma dos quadrados dos erros? 

Como vemos, esse processo de tentativa e erro, ou iterativo, pode ser implementado facil¬ 
mente. E se tivessemos tempo e paciencia infinitos, o processo de tentativa e erro poderia pro- 


4 Note que chamamos X'k de a soma dos quadrados dos erros e nao, como usualmente, de a soma dos qua¬ 
drados dos resfduos, porque estamos supondo que os valores dos parametros sejam conhecidos. 
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duzir valores de e /3 2 capazes de garantir a menor soma possivel dos quadrados dos erros. Mas, 
poderfamos perguntar, como passamos de (Pi = 0,45; = 0,01) para(/0i = 0,50; Pi=- 0,01)? 

Precisamos de algum tipo de algoritmo que nos indique como passamos de um conjunto de valo¬ 
res das incognitas para outro, ate parar. Felizmente, esses algoritmos estao disponlveis e serao discu- 
tidos na proxima seqiao. 


14.4 Abordagens para estimar modelos de regressao 
nao linear (MRNL) 

Ha varios procedimentos ou algoritmos para estimar os MRNLs: (1) a busca direta ou tentativa e 
erro, (2) a otimiza 5 ao direta e (3) a lineariza 5 ao iterativa. 5 

Metodo da busca direta ou da tentativa e erro ou metodo livre de 
derivada 

Na segao anterior, mostramos o funcionamento deste metodo. Embora seja intuitivamente atraen- 
te por nao exigir o recurso a metodos de calculo, como os outros, em geral ele nao e usado. Primeiro, 
se um modelo de regressao intrinsecamente nao linear envolve varios parametros, o metodo torna-se 
muito trabalhoso e dispendioso em termos de recursos computacionais. Por exemplo, se um modelo 
de regressao intrinsecamente nao linear envolve 5 parametros e 25 valores alternatives para cada um 
deles, sera necessario calcular a soma dos quadrados dos erros (25) 5 = 9.765.625 vezes! Em segundo 
lugar, nao ha garantia de que o conjunto final de valores dos parametros que for selecionado propor- 
cionara a soma dos quadrados dos erros absolutamente minima. Na linguagem de calculo, e possivel 
obter um mlnimo local, nao absoluto. Na verdade, nenhum metodo garante a obtencao de um mlnimo 
geral. 

Otimiza^ao direta 

Na otimizaqiao direta, derivamos a soma dos quadrados dos erros em relagao a cada coeficiente ou 
parametro desconhecido, igualamos a zero a equa£ao resultante e resolvemos simultaneamente as 
equa£oes normais resultantes. Ja vimos isso nas Equa£oes (14.2.4) e (14.2.5). Mas, como elas mos- 
tram, nao podem ser resolvidas explicita ou analiticamente. Faz-se necessario algum procedimento 
iterativo. Um deles e o chamado metodo da descida mais ingreme, que nao sera examinado em 
detalhes, pois e muito complexo, mas o leitor interessado encontrara sugestoes de leitura nas referen- 
cias. Como o metodo da tentativa e erro, o da descida mais Ingreme tambem recorre a valores iniciais 
provisorios dos parametros desconhecidos, mas depois torna-se mais sistematico que o da tentativa e 
erro. Uma de suas desvantagens e que pode ser extremamente demorado para chegar aos valores fi¬ 
nals dos parametros. 

Metodo da linearizagao iterativa 

Neste metodo, linearizamos uma equa£ao nao linear em tomo de alguns valores iniciais dos 
parametros. A equa£ao linearizada e, entao, estimada por MQO e os valores escolhidos inicialmente 
sao ajustados. Esses valores ajustados sao usados para relinearizar o modelo e novamente o estima- 
mos por MQO e reajustamos os valores estimados. O processo continua ate que nao haja mais alte- 
ra 5 oes substanciais nos valores estimados a partir das ultimas itera 5 oes. A principal tecnica usada para 
a linearizagao de uma equa§ao nao linear e a expansao de series de Taylor, do calculo. Na Seijao 


5 A discussao a seguir teve como fontes as seguintes obras: PINDYCK, Robert S.; RUBINFELD, Daniel L. Econometric 
models and economic forecasts. 4. ed. Nova York: McGraw-Hill, 1998. cap. 10; DRAPER, Norman R.; SMITH, 
Harry. Applied regression analysis. 3. ed. John Wiley & Sons, 1998. cap. 24; GOLDBERGER, Arthur S. A course in 
econometrics. Harvard University Press, 1991 cap. 29; DAVIDSON, Russell; MACKINNON, James, op. cit., 
p. 201-207; FOX, John. Applied regression analysis, linear models, and related methods. Sage Publications, 1997. 
p. 393-400; e GALLANT, Ronald. Nonlinear statistical models. John Wiley and Sons, 1987. 
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14A.2 do Apendice 14A, mostraremos alguns detalhes basicos do metodo. A estimagao do modelo de 
regressao intrinsecamente nao linear e sistematizada em dois algoritmos, conhecidos como o metodo 
iterativo de Gauss-Newton e o metodo iterativo de Newton-Raphson. Como um ou ambos os me- 
todos ja estao incorporados a varios programas de computador e uma vez que o exame de seus detalhes 
nos levaria muito alem do escopo deste livro, nao ha necessidade de examina-los detidamente. 6 Na 
proxima segao, examinaremos alguns exemplos que empregam esses metodos. 


14.5 Exemplos ilustrativos 


Consulte os dados da Tabela 14.1 e o MRINL (14.2.2). Por meio da rotina de regressao 
nao linear do EViews 6, que usa o metodo de linearizagao, 7 obtemos os seguintes resultados 
de regressao; os coeficientes, seus erros padrao e seus valores t sao apresentado em forma 
tabular: 


Variavel 

Coeficiente 

Erro 

Padrao 

Valor t 

p-Valor 

Intercepto 

0,5089 

0,0074 

68,2246 

0,0000 

Ativo 

-0,0059 

0,00048 

-12,3150 

0,0000 


R 2 = 0,9385 d = 0,3493 


Desses resultados, podemos escrever o modelo estimado como: 

Taxa, = 0,5089 Ativo~ 0,0059 ( 14 . 5 . 1 ) 

Antes de discutirmos esses resultados, podemos notar que, se nao fornecermos os valores 
iniciais dos parametros para iniciar o processo de linearizagao, o EViews fara isso. O EViews preci- 
sou de cinco iteragoes para obter os resultados da Equagao (14.5.1). No entanto, voce pode 
fornecer seus proprios valores iniciais para comegar o processo. Para demonstrarmos, escolhe- 
mos o valor inicial de fa = 0,45 e /J 2 = 0/01. Obtivemos os mesmos resultados da Equagao 
(14.5.1), mas precisamos de oito iteragoes. E importante observar que menos iteragoes serao 
necessarias se os seus valores iniciais nao estiverem muito distantes dos valores finais. Em alguns 
casos, podemos escolher os valores iniciais dos parametros efetuando a regressao de MQO do 
regressando contra os regressores, ignorando a nao linearidade. Por exemplo, com os dados da 
Tabela 14.1, se voce tivesse de fazer a regressao da taxa contra os ativos, a estimativa de MQO 
para fa seria de 0,5028 e a de fa seria —0,002, que estao muito proximos dos valores finais dos 
dados na Equagao (14.5.1). (Para detalhes tecnicos, consulte o Apendice 14A, Segao 14A.3.) 

Vejamos agora as propriedades dos estimadores de mfnimos quadrados nao lineares 
(MQNL). Recorde-se de que, no caso de modelos de regressao linear com termos de erro 
normalmente distribufdos, foi possfvel formular procedimentos de inferencia exatos (testes 
de hipoteses) para pequenas e grandes amostras, recorrendo aos testes t, Fe x 2 . Infelizmente, 
nao e esse o caso com os MRNLs, mesmo com termos de erros distribufdos normalmente. 
Os estimadores de mfnimos quadrados nao lineares nao estao normalmente distribufdos, nao 
sao nao tendenciosos e nao tern variancia minima em amostras finitas, pequenas. Como re- 
sultado, nao podemos usar o teste f (para verificar a significancia de um coeficiente indivi¬ 
dual) nem o teste F(para verificar a significancia geral da regressao estimada), porque nao 
e possfvel obter uma estimativa nao tendenciosa da variancia de erro a 2 com base nos 


EXEMPLO 14.1 

Taxas de 
assessoria em 
fundos mutuos 


( Continua ) 


6 Outro metodo as vezes usado, chamado de Metodo de Marquard, e um meio-termo entre o da descida mais 
fngreme e o da linearizagao (ou serie de Tayor). O leitor interessado podera consultar as referencias para saber 
detalhes sobre ele. 

z O EViews oferece tres opgoes: a subida quadratica, Newton-Raphson e Berndt-Hall-Hall-Hausman. A opgao pa¬ 
drao e a subida quadratica, uma variagao do metodo de Newton-Raphson. 
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EXEMPLO 14.1 

(< Continuagao ) 


resfduos estimados. Alem disso, a soma dos resfduos (a diferenga entre os valores Y reais e 
os valores Y estimados por meio do MRINL) nao resulta necessariamente em zero. A soma 
de SQE e SQR nao e necessariamente igual a SQT e, portanto, R 2 = SQE/SQT pode nao ser 
uma estatfstica descritiva para tais modelos. Entretanto, podemos calcular R 2 como: 

Eof 


R 2 = 1 - 


LOW) 2 


( 14 . 5 . 2 ) 


em que Y = regressando e u. = Y j —Y j em que Y i sao os valores estimados de Y para o mode- 
lo de regressao nao linear (ajustado). 

Em consequencia, as inferences sobre os parametros de regressao na regressao nao linear 
em geral se baseiam na teoria das amostras grandes. Essa teoria nos diz que, quando as amos- 
tras sao grandes, os estimadores de mfnimos quadrados e de maxima verossimilhanga de mo¬ 
delos de regressao nao linear com termos de erros normais distribuem-se quase normalmente, 
sao quase nao tendenciosos e tern variancia muito proxima da minima. A teoria das grandes 
amostras tambem se aplica quando os termos de erro nao sao normalmente distribufdos. 8 

Em resumo, todos os procedimentos de inferencia para MRNL sao para amostras grandes 
ou assintoticas. Voltando ao Exemplo 14.1, a estatfstica t da Equagao (14.5.1) so sera signifi- 
cativa se interpretada no contexto de amostras grandes. Nesse sentido, podemos dizer que 
os coeficientes estimados da Equagao (14.5.1) sao estatisticamente significativos, considera- 
dos de maneira individual. 


Voltando a Equagao (14.5.1), como podemos encontrar a taxa de variagao de Y( = taxa) com 
relagao a X (tamanho do ativo)? Por meio das regras basicas de derivadas, veremos que a taxa de 
variagao de Y com relagao a X e: 


dY 

dX 


= Afce** = 


(- 0.0059)(0,5089)e-° 0059X 


( 14 . 5 . 3 ) 


Portanto, a variagao da taxa cobrada depende dos valores dos ativos. Por exemplo, se 
X = 20 (milhoes), a taxa de variagao esperada do valor cobrado sera, segundo (14.5.3), 
cerca de —0,0031 %. Naturalmente, a resposta dependera do valor de X usado nos calculos. 
Com base no R 2 calculado por meio de (14.5.2), o R 2 de 0,9385 sugere que o modelo de 
regressao nao linear escolhido ajusta-se bem aos dados da Tabela 14.1. O valor de Durbin- 
Watson estimado, 0,3493, sugere que ha autocorrelagao ou um possivel erro de especifica- 
gao do modelo. Embora existam procedimentos para resolver esses problemas, bem como 
o da heterocedasticidade dos MRNL, nao os abordaremos aqui. O leitor interessado pode 
consultar as references. 


EXEMPLO 14.2 

A fungao de 
produgao 
Cobb-Douglas 
para a economia 
mexicana 


Tome os dados apresentados no Exercfcio 14.9 (Tabela 14.3). Eles se referem a economia 
mexicana para os anos de 1955-1974. Veremos se o MRNL da Equagao (14.1.4) ajusta-se aos 
dados, observando que Y = produgao, X 2 = trabalho e X 3 = capital. Usando o EViews 6, obti- 
vemos os seguintes resultados de regressao, apos 32 iterates. 


Variavel 

Coefidente 

Erro padrao 

Valor t 

p-Valor 

Intercepto 

0,5292 

0,2712 

1,9511 

0,0677 

Trabalho 

0,1810 

0,1412 

1,2814 

0,2173 

Capital 

0,8827 

0,0708 

12,4658 

0.0000 


R 2 = 0,9942 d= 0,2899 


Portanto, a estimativa da fungao de produgao de Cobb-Douglas e: 

pTb t = 0,5292TrabalhOf 181 °Capitalt 8827 ( 14 . 5 . 4 ) 

Interpretada assintoticamente, a equagao mostra que apenas o coeficiente do capital e signi¬ 
ficative neste modelo. No Exercfcio 14.9 pede-se uma comparagao desses resultados com os 
obtidos na fungao de produgao multiplicativa de Cobb-Douglas da Equagao (14.1.2). 


8 NETER, John; KUTNER, Michael H.; NACHTSHEIM, Christopher WASSERMAN, William. Applied regression 
analysis. 3. ed. Irwin, 1996. p. 548-549. 
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EXEMPLO 14.3 

Crescimento da 
populagao dos 
Estados Unidos, 
1970-2007 


FIGURA 14.2 

Popula^ao versus 
Ano. 


FIGURA 14.3 

Logaritmo da 
popula§ao versus 
ano. 


A tabela do Exercfcio 14.8 apresenta os dados sobre a populagao total nos Estados Unidos 
para o perfodo de 1970-2007. Um modelo logistico do seguinte tipo e usado com fre¬ 
quence para medir o crescimento de algumas populates, seres humanos, bacterias etc.: 


Yt = 


1 + 


+ 


u t 


(14.S.5) 


em que Y = populagao, em milhoes; t = tempo, medido cronologicamente; e os p sao os 
parametros. 

Este modelo e nao linear nos parametros; nao ha uma forma simples de converte-lo em um 
que seja linear nos parametros. Note um aspecto interessante neste modelo: embora haja ape- 
nas duas variaveis, populagao e tempo, ha tres parametros desconhecidos, o que mostra que 
em um MRNL pode haver mais parametros que variaveis. 

Uma tentativa de ajustar a Equagao (14.5.5) para nossos dados nao foi bem-sucedida, ja 
que todos os coeficientes estimados eram estatisticamente insignificantes. E provavel que isso 
nao seja surpresa, porque, se representarmos graficamente a populagao contra o tempo, 
obteremos a Figura 14.2. 
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Essa figura mostra que ha uma relagao quase linear entre as duas variaveis. Se tragarmos 
o grafico do logaritmo da populagao contra o tempo, obteremos a seguinte figura: 
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EXEMPLO 14.3 O coeficiente angular dessa figura (multiplicado por 100) da a taxa de crescimento da 
( Continuagao) populagao. (Por que?) 

De fato, se fizermos a regressao do logaritmo da populagao contra o tempo, obteremos 
os seguintes resultados: 


Dependent Variable: LPOPULATION 
Method: Least Squares 
Sample: 1970-2007 
Included observations: 38 


Coefficient 

Std 

. Error 

t-Statistic 

Prob. 

C -8.710413 

0 . 

147737 

-58.95892 

0.0000 

YEAR 0.010628 

7 . 

43E-05 

143.0568 

0.0000 

R-squared 

0.998244 

Mean 

dependent var. 

12.42405 

Adjusted R-squared 

0.998195 

S.D. 

dependent var. 

0.118217 

S.E. of regression 

0.005022 

Akaike info criterion 

-7.698713 

Sum squared resid. 

0.000908 

Schwarz criterion 

-7.612525 

Log likelihood 

148.2756 

Hannan-Quinn criter. 

-7.668048 

E-statistic 

20465.26 

Durbin-Watson stat. 

0.366006 

Prob. (E-statistic) 

0.000000 





Essa tabela mostra que, no perfodo de 1970-2007, a populagao dos Estados Unidos cres- 
ceu na taxa aproximada de 1,06% ao ano. O valor R 2 de 0,998 sugere que ha um ajustamen- 
to quase perfeito. 

Este exemplo ressalta um ponto importante: as vezes um modelo linear (nos parametros) 
pode ser prefenvel a um modelo nao linear (nos parametros). 


EXEMPLO 14.4 

Transformagao 
B ox- Cox: 
populagao dos 
EUA 1970-2007 


No Apendice 6A.5 consideramos brevemente a transformagao de Box-Cox. Continuemos 
com o Exemplo 14.3, mas supondo o seguinte modelo: 

Populagao* = Pi + fa Ano + u 

Como notado no Apendice 6A.5, dependendo do valor de X, temos as seguintes possibilidades: 


Valor de X 

Modelo 

-1 

-- — = Pi + p 2 Ano + u 

Populagao 

0 

In Populagao = Pi + Pi Ano + u 

1 

Populagao = Pi + P 2 Ano + u 


O primeiro e um modelo inverso, o segundo e um modelo semilogantmico (que ja estima- 
mos no Exemplo 14.3) e o terceiro e um modelo linear (nas variaveis). 

Qual deles e adequado para a populagao? A rotina Box-Cox no STATA (Versao 10) pode 
ser usada para responder a essa pergunta: 


H 0 do 
teste 

Log de 

verossimilhanga restrita 

estatlstica LR 
qui-quadrado 

Probabilidade de 
valor p > qui-quadrado 

e =~ 1 

-444,42475 

0,14 

0,707 

6=0 

-444,38813 

0,07 

0,794 

6 = 1 

-444,75684 

0,81 

0,369 


( Continua ) 
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EXEMPLO 14.4 

(' Continuagao ) 


Nota: em nossa notagao, teta (0) e o mesmo que (7). A tabela mostra que, com base no teste 
da razao de verossimilhanfa (RV), nao podemos rejeitar nenhum desses valores X como valo- 
res possfveis para o poder da populagao; isto e, no exemplo, modelos semilogaritmicos, in- 
versos, lineares sao candidatos a representar o comportamento da popula^ao no perfodo 
amostral 1970-2007. Portanto, apresentamos os resultados obtidos com os tres modelos: 


Variavel dependente 

Intercepto 

Coeficiente angular 

R 2 

1 / Popula<;ao 

0,000089 

- 4,28 e-08 

0,9986 


t (166,14) 

(-1568,10) 


In Popula^ao 

-8,7104 

0,0106 

0,9982 


t (-58,96) 

(143,06) 


Populafao 

-5042627 

2661,825 

0,9928 


t (- 66,92) 

(70,24) 



Em todos esses modelos os coeficientes estimados sao altamente significativos, em termos 
estatfsticos. Mas note que os valores de R 2 nao sao diretamente comparaveis, porque a varia- 
vel dependente e diferente nos tres modelos. 

Este exemplo mostra como as tecnicas de estimafao nao lineares podem ser aplicadas 
em situagoes concretas. 


Resumo e Os principals pontos discutidos neste capitulo podem ser resumidos como: 

conclusoes 

1. Embora os modelos de regressao linear predominem na teoria e na pratica, ha ocasioes em que os 
modelos de regressao nao linear nos parametros sao uteis. 

2. A matematica que fundamenta os modelos de regressao linear e comparativamente simples, per- 
mitindo a obtenfao de solufoes explicitas ou analiticas para os coeficientes desses modelos. A 
teoria da inferencia de amostras pequenas e grandes desses modelos tem ampla aceitagao. 

3. Em contrapartida, para modelos de regressao intrinsecamente nao linear (MRINL), os valores dos 
parametros nao podem ser obtidos explicitamente. Eles precisam ser estimados numericamente, isto 
e, por procedimentos iterativos. 

4. Ha varios metodos para obtermos os MRINLs, como (1) tentativa e erro, (2) mfnimos quadrados 
nao lineares (MQNL) e (3) lineariza^ao atraves da expansao da serie de Taylor. 

5. Programas de computador agora tem rotinas bem estabelecidas, como Gauss-Newton, Newton- 
—Raphson e Marquard. Estas sao rotinas iterativas. 

6. Os estimadores de mmimos quadrados nao lineares nao tem propriedades ideais em amostras 
finitas, mas em amostras grandes apresentam essas propriedades. Portanto, os resultados dos 
MQNL em amostras pequenas devem ser interpretados com cautela. 

7. Autocorrelac^ao, heterocedasticidade e problemas de especificacjao de modelo podem afetar os 
modelos de regressao linear, bem como os MRINL. 

8. Ilustramos os MQNL com varios exemplos. Com a disponibilidade de pacotes em softwares 
amigaveis a estima 5 ao dos MRINL nao deve mais ser um misterio. Portanto, o leitor nao deveria 
evitar esses modelos sempre que tiver razoes teoricas ou praticas para usa-los. De fato, se voltar- 
mos ao Exercicio 12.10, veremos pela Equa?ao (1) que ele e intrinsecamente um modelo de re¬ 
gressao nao linear que deveria ser estimado como tal. 
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EXERCICIOS 14.1. 0 que significam modelos de regressao intrinsecamente linear e intrinsecamente nao linear? 
De exemplos. 

14.2. Uma vez que o termo de erro da fungao de produgao Cobb-Douglas pode ser incluldo de modo 
multiplicativo ou aditivo, como poderfamos decidir qual deles empregar? 

14.3 Qual a diferenga entre a estimagao por MQO e por mmimos quadrados nao lineares 
(MQNL)? 

14.4. A relagao entre pressao e temperatura do vapor saturado pode ser expressa como:* 

Y = y6|(10) ftt/(y+,) + t i t 

em que Y — pressao e t — temperatura. Usando o metodo de mmimos quadrados nao lineares 
(MQNL), obtenha as equagoes normals para esse modelo. 

14.5. Indique se as seguintes afirmagoes sao verdadeiras ou falsas. Justifique sua resposta. 

a. A inferencia estatistica das regressoes de mmimos quadrados nao lineares nao pode ser 
feita com base nos testes t, F e / 2 , mesmo que se suponha que o termo de erro seja distri- 
bufdo normalmente. 

b. O coeficiente de determinagao (R 2 ) nao e um numero particularmente util para um 
MRINL. 

14.6. Como se faria a linearizagao da fungao de produgao CES examinada neste capitulo? Mostre as 
etapas necessarias. 

14.7. Os modelos que descrevem o comportamento de uma variavel com o tempo sao chamados de 
modelos de crescimento. Sao usados em diversos campos, como economia, biologia, botanica, 
ecologia e demografia. Os modelos de crecimento podem assumir varias fonnas, tanto lineares 
quanto nao lineares. Considere os modelos a seguir, em que Yea variavel cujo crescimento 
desejamos medir; te o tempo, medido cronologicamente; e it, e o termo de erro estocastico. 

a. Y, — Pi + + u t 

b. In Y t — + ^ 2 ^ + u t 

c. Modelo de crescimento logistico: Y t = | + + u t 

d. Modelo de crescimento de Gompertz: Y t = + u, 

Verifique as propriedades desses modelos considerando o crescimento de Y em relagao ao 
tempo. 

Exercicios aplicados 

14.8. ATabela 14.2 apresenta a populagao dos Estados Unidos, em milhoes de pessoas, para o perfo- 
do de 1970-2007. Ajuste os modelos de crescimento do Exercicio 14.7 e decida qual deles 
permite um ajustamento melhor. Interprete os parametros do modelo. 

14.9. A Tabela 14.3 apresenta dados sobre o PIB real, mao de obra e capital para o Mexico, para o 
perfodo de 1955-1974. Veja se a fungao de produgao multiplicativa de Cobb-Douglas da 
Equagao (14.1.2a) ajusta-se a esses dados. Compare seus resultados com os obtidos ao ajustar 
a fungao de produgao aditiva de Cobb-Douglas da Equagao (14.1.4), cujos resultados sao 
apresentados no Exemplo 14.2. Qual delas ajusta-se melhor? 


* Adaptado de Draper e Smith, op. cit., p. 554. 
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TABELA 14.2 


Populagao 


Popula^ao 

Ano 

Ano 

Populagao norte- 

1970 

205.052 

1989 

247.342 


1971 

207.661 

1990 

250.132 

1972 

209.896 

1991 

253.493 

1973 

211.909 

1992 

256.894 

1974 

213.854 

1993 

260.255 

1975 

215.973 

1994 

263.436 

1976 

218.035 

1995 

266.557 

1977 

220.239 

1996 

269.667 

1978 

222.585 

1997 

272.912 

1979 

225.055 

1998 

276.115 

1980 

227.726 

1999 

279.295 

1981 

229.966 

2000 

282.407 

1982 

232.188 

2001 

285.339 

1983 

234.307 

2002 

288.189 

1984 

236.348 

2003 

290.941 

1985 

238.466 

2004 

293.609 

1986 

240.651 

2005 

299.801 

1987 

242.804 

2006 

299.157 

1988 

245.021 

2007 

302.405 

Fonte: Economic Report of the President, 2008. 


TABELA 14.3 Dados da fun?ao de produ 9 §o para a economia mexicana 

Observa^ao 

PIB 

Mao de obra 

Capital 

Observagao 

PIB 

Mao de obra 

Capital 

1955 

114.043 

8.310 

182.113 

1965 

212.323 

11.746 

315.715 

1956 

120.410 

8.529 

193.749 

1966 

226.977 

11.521 

337.642 

1957 

129.187 

8.738 

205.192 

1967 

241.194 

11.540 

363.599 

1958 

134.705 

8.952 

215.130 

1968 

260.881 

12.066 

391.847 

1959 

139.960 

9.171 

225.021 

1969 

277.498 

12.297 

422.382 

1960 

150.511 

9.569 

237.026 

1970 

296.530 

12.955 

455.049 

1961 

157.897 

9.527 

248.897 

1971 

306.712 

13.338 

484.677 

1962 

165.286 

9.662 

260.661 

1972 

329.030 

13.738 

520.553 

1963 

178.491 

10.334 

275.466 

1973 

354.057 

15.924 

561.531 

1964 

199.457 

10.981 

295.378 

1974 

374.977 

14.154 

609.825 


Notas: PIB em milhoes de pesos de 1960. Mao de obra em millhoes de pessoas. Capital em milhoes de pesos de 1960. 

Fonte: ELIAS, Victor J. Sources of growth: a study of seven Latin American economies. International Center for Economic Growth, ICS Press, San Francisco, 1992, 
Tabelas E-5,E-12, E-14. 


Apendice 14A 


14A.1 Deriva^ao de equates (14.2.4) e (14.2.5) 

Escreva a Equagao (14.2.2) como 

u t = X - p t e^ x ‘ (1) 

Portanto, 

£ u ?=£( r ,-/^) 2 


(2) 
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A soma dos quadrados dos erros e, assim, uma fungao de f} 3 e fi 2 , ja que os valores de Y e X sao conhecidos. 
Para minimizarmos a soma dos quadrados dos erros, temos de obter as derivadas parciais em relagao as duas 
incognitas, o que da: 



(3) 


^ = 2 J2(Yi - 


(4) 


De acordo com a condigao de primeira ordem para otimizagao, igualando as equagoes anteriores a zero e 
resolvendo-as simultaneamente, obtemos as Equagoes (14.2.4) e (14.2.5). Note que, ao diferenciar a soma dos 
quadrados dos erros, empregamos a regra de cadeia. 


14A.2 O metodo de lineariza^ao 


Os estudantes familiarizados com o calculo se lembrarao do teorema de Taylor, que afirma que qualquer 
fungao arbitraria/(20 que seja contlnua e tenha uma derivada de ;?-esima ordem pode ser aproximada em tomo 
de um ponto X = X 0 por uma fungao polinomial e um resto, da seguinte maneira: 


f(X o) + f'{X 0 )(X- X 0 ) ^ f"(X 0 )(X- X 0 f ' 


. fiXo'KX-x 0 y , n 

+ --- 1 - K 


( 1 ) 


em que/'( X 0 ) e a primeira derivada def(X) avaliada em X = X 0 ,f" ( X 0 ) e a segunda derivada de/(X) avaliada 
em X = X 0 e assim por diante, em que n\ (leia-se “fatorial de n”) representa n(n — 1)(« — 2)... 1 com a con- 
vengao de que 0! = 1, e R representa o resto. Se tomamos n— 1, obtemos uma aproximagao linear; escolhendo 
n — 2, obtemos uma aproximagao polinomial de segundo grau. Como podemos esperar, quanto mais alta for a 
ordem do polinomio, melhor sera a aproximagao da fungao original. A serie dada na Equagao (1) e chamada de 
expansao da serie de Taylor f(X) em torno do ponto X = X 0 . Como exemplo imagine a fungao: 


Y = f(X) = ai + a 2 X+ ct 3 X 2 + a 4 X 3 


Suponha que desejemos aproxima-la no ponto X = 0. Agora obtemos: 


/(0) = <*i /'(0) = a 2 f"( 0) = 2a 3 /'"(0) = 6« 4 


Dai, podemos obter as seguintes aproximagdes: 

Primeira ordem: Y = u\+ = oq + a 2 X + resto (= a 3 X 2 + a 4 X 3 ) 


Segunda ordem: Y= /(0) + ^^ X+ ^~^~X 2 


= a\ + a 2 X + a 3 X 2 + resto (= a 4 X 3 ) 
Terceira ordem: Y = a i + a 2 X + a 3 X 2 + a 4 X 3 


A aproximagao de terceira ordem reproduz exatamente a equagao original. 

O objetivo da aproximagao da serie de Taylor em geral e escolher um polinomio de ordem inferior esperan- 
do que o resto seja desprezivel. Costuma-se usa-lo para aproximar uma fungao nao linear por meio de uma 
fungao linear, excluindo os termos de ordem mais elevada. 

A aproximagao das series de Taylor pode ser facilmente estendida a uma fungao com mais de um X. Por 
exemplo, considere a seguinte fungao: 


y = fiX, Z) 


(2) 
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e suponha que desejemos expandi-la em torno de X = a e Z = b. O teorema de Taylor mostra que 
f(x, z) = f(a, b) + f x (a, b)(x - a) 

+ fz(a, b)f{z - b) + b)(x - a) 2 (3) 

- 2 f xz (a, b)(x - a)(z - b) + f zz (a , b)(z - b ) 2 ] + ■ ■ • 


em que f x = derivada parcial da funjao com rela^ao a X,f xx = segunda derivada parcial da fun§ao em rela^ao a 
X e procedemos de forma analoga para a variavel Z. Se quisermos uma aproxima?ao linear a fun 9 ao, usaremos 
os dois primeiros tennos da Equaqao (3); se quisermos uma aproximaqao quadratica, de segundo grau, usare¬ 
mos os tres primeiros termos da Equafao (3) e assim por diante. 


14A.3 Aproxima^ao linear a fun^ao exponencial 
dada em (14.2.2) 


A fun 9 ao considerada e: 


Y = /(ft,ft) = fhe^x (1) 

Nota: para facilitar a manipulaqao, eliminamos os subscritos referentes a observaqao. 

Lembre-se de que nesta fun?ao as incognitas sao os coeficientes ft Vamos linearizar esta funjao em ft = ft 
e ft = 2 em que as quantidades destacadas com asterisco sao os valores fixos dados. Para linearizarmos, 

procedemos da seguinte maneira: 


Y = f(P 1, Pi) = API Pi) + MPl ft*)0 ft - Pi) + MPl Pirn - P' 2 ) (2) 

em que/^ 1 e/^ 0 sao as derivadas parciais da funqao (1) com respeito as incognitas e essas derivadas serao ava- 
liadas segundo os valores (presumidos) marcados por asterisco dos parametros desconhecidos. Note que usa- 
mos apenas as primeiras derivadas na expressao anterior, uma vez que estamos linearizando a funfao. Agora, 
suponha que ft = 0,45 e ft = 0,01, que sao palpites sobre o verdadeiro valor dos coeficientes. 

Agora 


/(ft = 0.45, Pl = 0,01) = 0,45e°' oljr ' 

hi = ehXi e hi = PiXe^ 


( 3 ) 


pelas regras padrao da deriva^ao. Avaliando essas derivadas aos valores dados e revertendo para a Equafao. (2), 
obtemos: 


Yi = 0.45e oolx - + e°' 01Xi (pi - 0,45) + (0.45)X,e 001Ar '(ft - 0,01) ( 4 ) 

que escrevemos como: 

(Yi - 0,45e°' 01A| ) = e 0MX ‘ai + 0,45X,e°' 01A 'a 2 (5) 

em que 

a, = (p\ - 0,45) e a 2 = (ft - 0,01) (6) 

Agora sejaft = (T, - 0,45e 001A ‘), X\ = e 0 0lx ‘, e X 2i = 0,45X,e 0 01 A. Usando essas deftni^oes e adicionando 
o termo de erro u h podemos finalmente escrever a Equaqao (5) como: 

Yj = aiXu + 0 . 2 X 21 + Ui ( 7 ) 

e encontramos com um modelo de regressao linear. Uma vez que Y*, X u e X 2j podem ser calculados prontamen- 
te com base nos dados, podemos estimar facilmente a Equa§ao (7) pelos MQO e obter os valores de oq e a 2 . 
Entao, da Equa 9 §o (6), obtemos: 


ft = ft + 0,45 


ft = ft + 0,01 


( 8 ) 
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Vamos chamar esses valores de fi\ ' e fiT, respectivamente. Usando os valores (revisados), podemos comegar o 
processo iterativo dado na Equagao (2), obtendo outro conjunto de valores dos coeficientes p. Podemos conti- 
nuar efetuando a iteragao (ou linearizagao) ate que nao haja alteragao substancial nos valores dos coeficientes 
p. No Exemplo 14.1, foram necessarias cinco iteragdes, mas para o exemplo da fungao Cobb-Douglas para 
economia mexicana (Exemplo 14.2), efetuaram-se 32 iteragoes. A logica que fundamenta essas iteragoes e o 
procedimento que acabamos de ilustrar. 

Para a estrutura de taxas de fundos mutuos em 14.3, Y*, Aj e X 2 da Equagao (6) sao os mostrados na Tabe- 
la 14.4; os dados basicos sao apresentados na Tabela 14.1. Desses valores, os resultados da regressao corres- 
pondentes a Equagao (7) sao: 


Dependent variable: Y* 
Method: Least squares 


TABELA 14.4 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

Xi 

0.022739 

0.014126 

1.609705 

0.1385 

X 2 

-0.010693 

0.000790 

-13.52990 

0.0000 

R 2 = 0.968324 Durbin-Watson 

d statistic = 

= 0.308883 


Agora, usando a Equagao (8), o leitor pode verificar que 




= 0,4727 

e P' 2 =- 0,00069 



Y* 


*2 

0,067744 

1,005013 

0,226128 

0,034928 

1,051271 

2,365360 

-0,013327 

1,105171 

4,973269 

-0,062825 

1,161834 

7,842381 

-0,109831 

1,221403 

10,99262 

-0,154011 

1,284025 

14,44529 

-0,195936 

1,349859 

18,22309 

-0,236580 

1,419068 

22,35031 

-0,276921 

1,491825 

26,85284 

-0,317740 

1,568312 

31,75832 

-0,397464 

1,733253 

42,89801 

-0,446153 

1,822119 

49,19721 


( 9 ) 


Compare esses numeros com os palpites iniciais de 0,45 e 0,01, respecdvamente, para os dois parametros. 
Usando as novas estimativas na Equagao (9), podemos dar infcio ao procedimento iterativo mais uma vez e 
continuar ate que haja “convergencia”, no sentido de que a rodada final das estimativas nao seja muito diferen- 
te da rodada anterior. Poderemos precisar de menos iteragoes se nosso palpite inicial for mais proximo dos 
valores finais. Alem disso, note que usamos apenas o tenno linear na expansao das series de Taylor. Se tivesse- 
mos de usar os termos quadraticos ou de ordem superior na expansao, talvez chegariamos aos valores finais 
mais rapidamente; mas em muitas aplicagdes a aproximagao linear provou ser muito boa. 









Modelos de regressao de 
resposta qualitativa 

Em todos os modelos de regressao que consideramos ate agora, consideramos implicitamente que 
o regressando, a variavel dependente, ou variavel de resposta Y, e quantitativa, enquanto as variaveis 
explanatorias sao quantitativas, qualitativas (on binarias), ou lima combinaijao delas. De fato, no 
Capftulo 9, sobre variaveis binarias, vimos como os regressores binarios sao introduzidos em um 
modelo de regressao e que papel desempenham em situa 9 oes especificas. 

Neste capftulo, consideraremos varios modelos em que o regressando em si e de natureza quali¬ 
tativa. Embora cada vez mais utilizados em varias areas das ciencias sociais e da pesquisa medica, os 
modelos de regressao de resposta qualitativa impdem desafios interessantes de estimatjao e interpre- 
tapao. Neste capitulo apenas tocaremos em alguns dos principais temas desta area, deixando os por- 
menores para livros mais especializados . 1 


15.1 A natureza dos modelos de resposta qualitativa 


Suponha que queiramos estudar a decisao dos homens adultos de participar da for 9 a de trabalho, 
que denominamos PFT. Uma vez que um adulto esta ou nao na femja de trabalho, a PFT e uma decisao 
do tipo sim ou nao. A variavel de resposta, ou regressando, pode ter apenas dois valores, 1 quando a 
pessoa esta na for£a de trabalho e 0 se ela nao esta. Em outras palavras, o regressando e uma variavel 
binaria, ou dicotomica. Pesquisas sobre economia do trabalho sugerem que a decisao e uma fun£ao 
da taxa de desemprego, do salario medio, da escolaridade, da renda familiar etc. 

Como outro exemplo, considere as eleipoes presidenciais nos Estados Unidos. Suponhamos que 
existam dois partidos politicos, Democrata e Republicano. A variavel dependente aqui e a oppao de 
voto entre os dois partidos politicos. Seja Y = 1, se o voto for para um candidato democrata, e Y = 0, 
se o voto for para um candidato republicano. Uma quantidade consideravel de pesquisas sobre este 
tema foi feita pelo economista Ray Fair da Universidade de Yale e por diversos cientistas politicos . 2 
Algumas das variaveis utilizadas na escolha do voto sao a taxa de crescimento do P1B, taxas de de¬ 
semprego e inflafao, se o candidato esta candidatando-se a reeleipao etc. Para nossos objetivos, o 
importante e que o regressando e uma variavel qualitativa. 

Podemos pensar em varios outros exemplos em que o regressando tem natureza qualitativa. Uma 
famflia tem casa propria ou nao, ela tem seguro contra invalidez ou nao, tanto o marido como a mu- 

1 No nfvel introdutorio, o leitor podera encontrar as seguintes fontes muito uteis. POWERS, Daniel A.;XIE, Yu. 
Statistical methods for categorical data analysis. Academic Press, 2000; ALDRICH, John H.; NELSON, Forrest. Line¬ 
ar probability, logit, and probit models. Sage Publications, 1984; e LIAO, Tim Futing. Interpreting probability mo¬ 
dels: logit, probit and other generalized linear models. Sage Publications, 1994. Para uma revisao geral da 
literatura espedfica, veja MADDALA, G. S. Limited-dependent and qualitative variables in econometrics. Cambridge 
University Press, 1983. 

2 Veja, por exemplo, FAIR, Ray. "Econometrics and presidential elections." lournal of Economic Perspective, p. 89-102, 
1996; e LEWIS-BECK, Michael S. Economics and elections: the major western democracies. Ann Arbor: University 
of Michigan Press, 1980. 
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lher estao na for£a de trabalho ou apenas a esposa esta. Da mesma forma, uma certa droga e ou nao 
eficaz na cura de uma doen 5 a. Uma empresa decide declarar dividendos em a 9 oes ou nao, um senador 
decide votar em favor do corte de um imposto ou nao, um presidente norte-americano decide vetar ou 
sancionar uma lei etc. 

Nao temos de restringir a variavel de resposta apenas as categorias dicotomicas sim/nao. Voltando 
ao exemplo de elei?oes presidenciais, suponha que haja tres partidos, Democrata, Republicano e Inde- 
pendente. A variavel de resposta, nesse caso, sera tricotomica. Em geral, podemos ter uma variavel de 
escolha policotomica (ou de multiplas categorias). 

O que planejamos fazer e considerar primeiro o regressando dicotomico e entao considerar varias 
extensoes do modelo basico. Mas antes, e importante notar uma diferenpa fundamental entre um 
modelo de regressao em que o regressando Y e quantitative e um modelo em que e qualitative. 

Em um modelo no qual Y e quantitative, nosso objetivo e estimar seu valor esperado, ou medio, dados 
os valores dos regressores. Conforme o Capftulo 2, o que desejamos e E(Y l \ X u , Z 2 ,-,..., X ki ), em que os 
regressores X sao quantitativos e qualitativos. Em modelos nos quais Y e qualitative, nosso objetivo e 
encontrar a probabilidade de que algo aconte 9 a, como o voto em um candidato democrata, ou a aquisigao 
da casa propria, ou pertencer a um sindicato, ou participar de um esporte etc. Portanto, os modelos de 
regressao de escolha qualitativa sao muitas vezes conhecidos como modelos de probabilidade. 

Neste capitulo, procuraremos responder as seguintes perguntas: 

1. Como estimar modelos de escolha qualitativa? Podemos apenas estima-los usando os proce- 
dimentos habituais dos MQO? 

2. Ha problemas especiais de inferencia? Em outras palavras, os procedimentos de teste de 
hipoteses sao diferentes dos que aprendemos ate agora? 

3. Se um regressando for qualitative, como poderemos medir a qualidade do ajustamento desses 
modelos? O R 2 calculado da forma convencional tem algum valor no caso desses modelos? 

4. De que maneira estimamos e interpretamos os modelos de regressao policotomicos? Como 
lidar com modelos em que o regressando e ordinal, ou seja, uma variavel de categorias or- 
denadas, como escolaridade (menos de 8 anos, de 8 a 11 anos, 12 anos, mais de 13 anos) ou 
o regressando e nominal, ou seja, nao ha ordena 9 ao, como ra 9 a (negros, brancos, hispani- 
cos, asiaticos e outros)? 

5. De que modo modelamos fenomenos como o numero anual de consultas medicas; o numero 
de patentes registradas por uma empresa em certo ano; o numero de artigos publicados por 
um docente em um ano; o numero de telefonemas atendidos em um intervalo de cinco mi- 
nutos; ou o numero de automoveis que passam por uma cabine de pedagio em cinco minu- 
tos? Esses fenomenos, chamados de dados contaveis ou eventos raros, sao um exemplo do 
processo de (probabilidade) Poisson. 

Neste capftulo, daremos respostas elementares a algumas dessas perguntas, pois alguns desses 
topicos sao bastante avan^ados e exigem uma base de matematica e estatistica acima daquela pressu- 
posta neste livro. As referencias nas notas de rodape podem ser consultadas para maiores detalhes. 

Come 5 aremos o estudo dos modelos de escolha qualitativa considerando, primeiro, o modelo de 
regressao de escolha binaria. Ha quatro abordagens para formular um modelo probabilfstico para 
uma variavel de escolha binaria: 

1. O modelo de probabilidade linear (MPL) 

2. O modelo logit 

3. O modelo probit 

4. O modelo tobit 

Dada a sua simplicidade comparativa e a possibilidade de estima-lo por MQO, comecaremos com 
o modelo de probabilidade linear, deixando os outros tres para as proximas se 5 oes. 
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15.2 O modelo de probabilidade linear (MPL) 

Considere o seguinte modelo de regressao: 

Yi = P\ + fcXi + Ui ( 15 . 2 . 1 ) 

em que X = renda familiar e Y = 1 se a famflia tiver um imovel e 0 se nao tiver. 

O (15.2.1) parece ser um modelo tfpico de regressao linear, mas como o regressando e binario, ou 
dicotomico, ele e chamado de modelo de probabilidade linear (MPL). Isso ocorre porque a expecta- 
tiva condicional de Y, dado X ,, E( Y, \ X ,), pode ser interpretada como probabilidade condicional de 
que o evento ocorra dado X-, , isto e, Pr (K, = 1 X,). Assim, em nosso exemplo, E(Yj \ X,) apresenta a 
probabilidade de uma famflia ter um imovel e cuja renda e dada pelo montante X t . 

A justificativa do nome modelo de probabilidade linear para modelos como a Equagao (15.2.1) 
pode ser vista a seguir. Supondo £(n,) = 0, como de costume (para obter estimadores nao tendencio- 
sos), obtemos 


E{Y t \X t )= hXi ( 15 . 2 . 2 ) 

Agora, se P , = probabilidade de que Y i = 1 (de que o evento ocorra) e (1 — P,) = probabili¬ 
dade de que Y t = 0 (de que o evento nao ocorra), a variavel Y, tem a seguinte distribuigao (de 
probabilidade): 


Yi Probabilidade 

0 1 - P, 

1 Pi 

Total 1 


Isto e, Yi segue a distribuigao de probabilidade de Bernoulli. 

Por definigao de esperanga matematica, obtemos: 

E{Y,)= 0(1- Pi)+ 1 (/>)= Pi (15.2.3) 

Comparando a Equagao (15.2.2) com a (15.2.3), podemos igualar 

E(Yi\Xi)= p l+ foXi = Pi ( 15 . 2 . 4 ) 

ou seja, a esperanga condicional do modelo (15.2.1) pode, de fato, ser interpretada como a probabilidade 
condicional de Y t . Em geral, a esperanga de uma variavel de Bernoulli e a probabilidade de que a variavel 
aleatoria seja igual a 1. Observe que se houver n experimentos independentes, cada um com uma proba¬ 
bilidade p de sucesso e probabilidade (1 — p) de fracasso, e X desses experimentos representarem o 
numero de sucessos, dizemos que X segue a distribuigao binomial. A media de uma distribuigao bino¬ 
mial e rip e sua variancia e np( 1 — p). O termo sucesso e definido no contexto do problema. 

Uma vez que a probabilidade P , deve estar entre 0 e 1, temos a restrigao 

0 < E(Y t | Xi) < 1 ( 15 . 2 . 5 ) 

ou seja, a esperanga (ou probabilidade) condicional deve estar entre 0 e 1. 

Pela discussao anterior, pode parecer que os MQO sao estendidos com facilidade aos modelos de 
regressao com variaveis dependentes binarias. Talvez nao haja nada de novo nisso. Infelizmente, nao 
e esse o caso, pois o modelo de probabilidade linear apresenta varios problemas. 
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Ausencia de normalidade dos termos de erro u, 

Embora os MQO nao exijam que os termos de erro (it,) sejam normalmente distribmdos, consi- 
deramos tal distribuigao para fins de inferencia estatistica. 3 No entanto, a hipotese de normalidade 
de itj nao se sustenta no caso dos modelos de probabilidade linear, porque, como Y„ os termos de erro 
Uj tambem assumem apenas dois valores; eles tambem seguem a distribuigao de Bernoulli. Isso pode 
ser visto claramente se escrevermos (15.2.1) como 

u, = Y t - Pi - p 2 Xj (15.2.6) 

A distribuigao de probabilidade de m, e 


u, Probabilidade 

Quando Y-, = 1 1 - Pi - PiX, Pi (15.2.7) 

Quando Y, = 0 - Pi - /S 2 X,- (1 - P,) 


Obviamente, nao podemos pressupor que os u, sejam normalmente distribmdos; eles seguem a 
distribuigao de Bernoulli. 

Mas o fato de nao observarmos a validade da hipotese de normalidade pode nao ser tao fundamen¬ 
tal quanto parece, porque sabemos que as estimativas pontuais de MQO ainda permanecem nao ten- 
denciosas (recorde-se de que, se o objetivo for a estimagao pontual, a hipotese de normalidade deixa 
de ser necessaria). Alem disso, a medida que o tamanho da amostra aumenta indefinidamente, a teoria 
estatistica mostra que os estimadores de MQO tendem, no geral, a distribuir-se normalmente. 4 Em 
consequencia, no caso de grandes amostras, a inferencia estatistica dos modelos de probabilidade li¬ 
near seguira os procedimentos habituais de MQO sob a hipotese de normalidade. 

Variancias heterocedasticas dos termos de erro 

Mesmo que E(u[) = 0 e cov (u„ uj) = 0 para i A j (inexistencia de correlagao serial), nao se pode 
mais afirmar que no MPL os termos de erro sao homocedasticos. No entanto, nao e de surpreender que 
sejam. Como mostra a teoria estatistica, para uma distribuigao de Bernoulli, a media e a variancia 
teoricas sao, respectivamente, p e p( I — p), em que p € a probabilidade de sucesso (de ocorrencia de 
alguma coisa), mostrando que a variancia e uma fungao da media. Portanto, a variancia do erro e he- 
terocedastica. 

Para a distribuiqao do termo de erro da Equa 9 ao (15.2.7), aplicando a definifao de variancia, o 
leitor deveria verificar que (veja o Exercicio 15.10) 

var(w,) = P,( 1 - Pi) (15.2.8) 

a variancia do termo de erro no MPLe heterocedastica. Como = E(Y, \ X,) = /fi + [EX,, a varian¬ 
cia de Uj depende dos valores de X e por isso nao e homocedastica. 

Ja sabemos que, na presenga da heterocedasticidade, os estimadores de MQO, embora nao sejam 
tendenciosos, nao sao eficientes; isto e, nao tem variancia minima. Mas o problema da heterocedasti¬ 
cidade, como o problema da distribuigao nao normal, nao e insuperavel. No Capftulo 11, discutimos 
varios metodos para lidar com o problema da heterocedasticidade. Como a variancia de u, depende 
de E(Yj | X[), uma forma de resolver o problema da heterocedasticidade e transformar o modelo 
(15.2.1) dividindo-o por 


3 Lembre-se de que recomendamos que a hipotese de normalidade fosse verificada por meio dos testes de nor¬ 
malidade adequados, como o teste de Jarque-Bera. 

4 A demonstragao apoia-se no teorema central do limite e pode ser encontrada em MALINVAUD, E. Statistical methods 
of econometrics. Chicago: Rand McNally, 1966, p. 195-197. Se os regressores forem considerados estocasticos e 
tiverem, em conjunto, distribuigao normal, os testes F e t ainda podem ser aplicados mesmo que os termos de 
erro nao tenham distribuigao normal. Tambem convem ter em mente que, a medida que o tamanho da amostra 
cresce indefinidamente, a distribuigao binomial converge para a distribuigao normal. 
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isto e, 


jEiY^XfiV- E{Y,\Xi)\ = /?,(! - Pi) = diz ^ 



( 15 . 2 . 9 ) 


Como podemos verificar, o termo de erro transformado na Equapao (15.2.9) e homocedasti- 
co. Depois de calcularmos a Equapao (15.2.1), podemos estimar a Equapao (15.2.9) pelos MQO, 
que nao e nada mais do que os mmimos quadrados ponderados (MQP) com os w, servindo 
como pesos. 

Na teoria, o que acabamos de descrever e valido, mas na pratica a verdadeira E( Y t \ X t ) e desco- 
nhecida; os pesos vv, sao desconhecidos. Para estimar vv„ podemos usar o seguinte procedimento, em 
duas etapas: 5 


Etapa 1. Fazemos a regressao de MQO (15.2.1) apesar do problema da heterocedasticidade e obtemos 
F, = estimativa da verdadeira £(i' | X,). Entao obtemos = F,( 1 — F ; ), a estimativa de w,-. 

Etapa 2. Usamos o w, para transformar os dados como mostramos na Equapao (15.2.9) e calculamos a 
equapao transformada por MQO (os rmnimos quadrados ponderados). 

Esse procedimento sera ilustrado em breve, porem, podemos usar os erros padrao corrigidos para 
heterocedasticidade de White para lidar com a heterocedasticidade, contanto que a amostra seja razoavel- 
mente grande. 

Mesmo corrigindo para heterocedasticidade, primeiro precisamos tratar outro problema que afeta 
oMPL. 


Impossibilidade de satisfazer 0 < E(K, | X,) < 1 

Como E(Yj | Xj), nos modelos de probabilidade linear, mede a probabilidade condicional de que o 
evento Y ocorra dado X, ele se situa necessariamente entre 0 e 1. Embora isso seja verdade, a priori 
nada garante que os F ; , os estimadores de E{Y t \ X,), satisfapam necessariamente essa restripao, e esse 
e o problema real da estimativa dos modelos de probabilidade linear por MQO. Tal fato acontece, 
porque os MQO nao levam em conta a restripao de que 0 < E( Y,) < 1 (uma restripao de desigualdade). 
Ha duas maneiras de verificar se o F, estimado situa-se entre 0 e 1. Uma delas e estimar o MPL pelo 
metodo habitual de MQO e constatar se F, situa-se entre 0 e 1. Se alguns forem menores que 0 (nega¬ 
tives), consideraremos que F, seja zero nesses casos; se forem maiores que 1, consideraremos que se- 
jam iguais a 1. O segundo procedimento e formular uma tecnica de estimapao que garanta que as 
probabilidades condicionais F , estarao entre 0 e 1. Os modelos logit e probit garantirao que as proba- 
bilidades estimadas de fato situam-se entre os limites logicos 0 e 1. 

O valor de R 2 como medida de qualidade do ajustamento e 
questionavel 

O R 2 calculado da forma convencional e de valor limitado quando se trata de modelos de es- 
colha dicotomica. Para ver por que, considere a Figura 15.1. Correspondendo a um dado X, Y e 0 
ou 1. Portanto, todos os valores de F ficarao ao longo do eixo X ou da linha correspondente a 1. 
Em geral nao se espera que nenhum MPL ajuste-se bem a um grafico de dispersao; seja o modelo 
de probabilidade linear irrestrito (Figura 15.1a), seja o truncado ou restrito (Figura 15.1b), um 
modelo de probabilidade linear estimado dessa maneira nao ficara fora da faixa logica 0-1. Em 


5 A justificativa deste procedimento pode ser vista em COLDBERCER, Arthur S. Econometric theory. Nova York: John 
Wiley & Sons, 1964, p. 249-250. Esta justificativa apoia-se praticamente em uma grande amostra como a que 
discutimos ao tratar dos mfnimos quadrados generalizados no capftulo dedicado a heterocedasticidade (veja a 
Sepao 11.6). 
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MPL 



(c) 

consequencia, o R 2 calculado da forma convencional costuma situar-se muito abaixo de 1. Na 
maioria das aplicagoes praticas, o R 2 situa-se entre 0,2 e 0,6. Nesses modelos, R 2 sera alto, por 
exemplo, acima de 0,8, apenas quando os dados observados aglomerarem-se em torno dos pontos 
A e B (Figura 15.1c), pois e facil determinar a reta ao unir os dois pontos A e B. Nesse caso, o Y,- 
previsto estara muito proximo ou de 0 ou de 1. 

Por essas razoes, John Aldrich e Forrest Nelson afirmam que “o uso do coeficiente de determinagao 
como estatfstica sintetica deveria ser evitado em modelos com a variavel dependente qualitativa”. 6 


EXEMPLO 15.1 

MPL: um 
exemplo 
numeric o 


Para ilustrarmos alguns pontos da segao anterior, apresentaremos um exemplo numerico. 
A Tabela 15.1 fornece dados ficticios relativos a posse da casa propria Y( 1 = possui uma casa, 
0 = nao possui uma casa) e renda familiar X (milhares de dolares) para 40 famflias. Com base 
nesses dados, o MPL estimado pelo MQO apresentou os seguintes resultados: 

Yj = -0,9457 + 0,1021X, 

(0,1228) (0,0082) (15.2.10) 

t= (-7,6984) (12,515) R 2 = 0,8048 

Primeiro vamos interpretar a regressao. O intercepto de —0,9457 apresenta a "probabilida- 
de" de que uma familia com renda zero tenha uma casa. Como esse valor e negativo, e a 
probabilidade nao pode ser negativa, tratamos o valor como zero, o que aqui se justifica. 7 O 
valor da inclinagao de 0,1021 indica que, por uma variagao de uma unidade na renda (neste 
caso, $ 1.000), em media a probabilidade de possuir uma casa propria aumenta em 0,1021 
ou cerca de 10%. 

( Continua ) 


6 ALDRICH e NELSON, op. cit., p. 15. Para outras medidas da qualidade do ajuste em modelos que envolvem 
regressandos binarios, veja AMEMIYA, T. "Qualitative response models." Journal of Economic Literature, 1981. 
v. 19, p. 331-354. 

7 Pode-se interpretar por alto o valor extremamente negativo como quase uma improbabilidade de se ter uma 
casa propria quando a renda e zero. 
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EXEMPLO 15.1 

( Continuagao ) 


Evidentemente, dado o nfvel particular de renda, podemos estimar a probabilidade real de 
ter uma casa por meio da Equa^ao (15.2.10). Para X = 12 ($ 12.000), a probabilidade esti- 
mada de possuir uma casa propria e 

(Yj\X= 12)= -0,9457+ 12(0,1021) 

= 0,2795 


TABELA 15.1 Dados hipoteticos relativos a posse da casa propria (Y = 1 se tiver casa propria, 0 se nao 
tiver) e renda X (milhares de dolares) 


Familia 

Y 

X 

Familia 

Y 

X 

1 

0 

8 

21 

1 

22 

2 

1 

16 

22 

1 

16 

3 

1 

18 

23 

0 

12 

4 

0 

11 

24 

0 

11 

5 

0 

12 

25 

1 

16 

6 

1 

19 

26 

0 

11 

7 

1 

20 

27 

1 

20 

8 

0 

13 

28 

1 

18 

9 

0 

9 

29 

0 

11 

10 

0 

10 

30 

0 

10 

11 

1 

17 

31 

1 

17 

12 

1 

18 

32 

0 

13 

13 

0 

14 

33 

1 

21 

14 

1 

20 

34 

1 

20 

15 

0 

6 

35 

0 

11 

16 

1 

19 

36 

0 

8 

17 

1 

16 

37 

1 

17 

18 

0 

10 

38 

1 

16 

19 

0 

8 

39 

0 

7 

20 

1 

18 

40 

1 

17 


Isto e, a probabilidade de que uma familia com renda de $ 12.000 tenha casa propria e 
de cerca de 28%. A Tabela 1 5.2 mostra as probabilidades estimadas, Y u para varios nfveis 
de renda listados. O aspecto mais notavel dessa tabela e que seis valores estimados sao 
negativos e seis estao acima de 1, demonstrando claramente o que expusemos anterior- 
mente, que, embora E(Y t | X,) seja positiva e menor que 1, seus estimadores, V}, nao preci- 
sam ser necessariamente positivos ou menores que 1. Essa e uma das razoes pela qual o 
MPL nao e o modelo recomendado quando a variavel dependente for dicotomica. 

Mesmo que os V, estimados fossem todos positivos e menores que 1, o modelo de 
probabilidade linear ainda apresentaria o problema de heterocedasticidade, o que pode 
ser visto facilmente pela Equafao (15.2.8). Em consequencia, nao podemos contar com 
os erros padrao estimados dados na Equafao (15.2.10). (Por que?) Mas podemos usar o 
procedimento dos mfnimos quadrados ponderados (MQP) discutido anteriormente para 
obter estimativas mais eficientes dos erros padrao. Os pesos necessarios, vv, , exigidos para 
a aplica^ao dos MQP, tambem aparecem na Tabela 15.2. Mas note que, como os Y, sao 
negativos e alguns outros sao superiores a 1, os vv, correspondente a esses valores serao 
negativos. Nao podemos usar essas observances em MQP (por que?), reduzindo, assim, o 
numero de observances, de 40 para 28 neste exemplo 8 . Omitindo essas observances, a re- 
gressao de MQP e: 

( Continua ) 


8 Para evitar a perda de graus de liberdade, podemos fazer Y) = 0,01 quando os V) estimados forem negativos e 
Yj = 0,99 quando forem superiores ou iguais a 1. Veja o Exercfcio 15.1. 
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( Continuagao ) 


Yi 

Wi 


-1,2456 

(0,1206) 
t = (-10,332) 


+ 0,1196 

(0,0069) 

(17,454) 


X, 


R 2 = 0,9214 


( 15 . 2 . 11 ) 


TABELA 15.2 Y real, Y estimado e pesos w,- para o exemplo de posse de casa propria 


Y, 

Yi 

Wi* 

V'wo 

Yi 

Yi 

w* 


0 

-0,129* 



1 

1,301 f 



1 

0,688 

0,2146 

0,4633 

1 

0,688 

0,2147 

0,4633 

1 

0,893 

0,0956 

0,3091 

0 

0,280 

0,2016 

0,4990 

0 

0,178 

0,1463 

0,3825 

0 

0,178 

0,1463 

0,3825 

0 

0,280 

0,2016 

0,4490 

1 

0,688 

0,2147 

0,4633 

1 

0,995 

0,00498 

0,0705 

0 

0,178 

0,1463 

0,3825 

1 

1,098* 



1 

1,097* 



0 

0,382 

0,2361 

0,4859 

1 

0,893 

0,0956 

0,3091 

0 

-0,0265* 



0 

0,178 

0,1463 

0,3825 

0 

0,076 

0,0702 

0,2650 

0 

0,076 

0,0702 

0,2650 

1 

0,791 

0,1653 

0,4066 

1 

0,791 

0,1653 

0,4055 

1 

0,893 

0,0956 

0,3091 

0 

0,382 

0,2361 

0,4859 

0 

0,484 

0,2497 

0,4997 

1 

1,1991 



1 

1,097 t 



1 

1,097+ 



0 

-0,333* 



0 

0,178 

0,1463 

0,3825 

1 

0,995 

0,00498 

0,0705 

0 

-0,129* 



1 

0,688 

0,2147 

0,4633 

1 

0,791 

0,1653 

0,4066 

0 

0,076 

0,0702 

0,2650 

1 

0,688 

0,2147 

0,4633 

0 

-0,129* 



0 

-0,231* 



1 

0,893 

0,0956 

0,3091 

1 

0,791 

0,1653 

0,4066 


* Tratado como zero para evitar probabilidades negativas. 
f Tratado como unidade para evitar unidades acima de 1. 

* y,(i - y ,) 


Esses resultados mostram que, comparados a Equagao (15.2.10), os erros padrao esti- 
mados sao menores e, correspondentemente, as razoes t estimadas (em valores absolu- 
tos) sao maiores. Mas tais resultados devem ser considerados com reserva, uma vez que, 
ao calcularmos a Equafao (1 5.2.11), tivemos de excluir 1 2 observances. Alem disso, uma 
vez que os w, sao estimados, os procedimentos estatfsticos habituais de teste de hipoteses 
sao, em termos estritos, validos em amostras grandes (veja o Capftulo 11). 


15.3 Aplica^oes do modelo de probabilidade linear (MPL) 


Antes que pacotes computacionais para estimar os modelos logit e probit (que serao discutidos 
em breve) fossem acessfveis, o modelo de probabilidade linear era muito usado, tendo em vista 
sua simplicidade. Seguem algumas dessas aplicanoes. 
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EXEMPLO 15.2 

0 estudo 

Cohen-Rea- 

Lerman 9 


Em um estudo preparado para o U.S. Department of Labour (Departamento do Trabalho 
dos Estados Unidos), Cohen, Rea e Lerman examinaram a participagao na for^a de trabalho 
de varias categorias ocupacionais como fungao de diversas variaveis socioeconomicas e de- 
mograficas. Em todas as regressoes, a variavel dependente era binaria, assumindo o valor de 
1 se a pessoa estivesse empregada e 0 em caso contrario. Na Tabela 15.3, reproduzimos um 
dos varios regressores. 

Antes de interpretarmos os resultados, vale destacarmos estes aspectos: a regressao ante¬ 
rior foi estimada por MQO. Para levarem em conta a heterocedasticidade, os autores adota- 
ram o procedimento em duas etapas ja visto em algumas de suas estimativas, mas verificaram 
que os erros padrao das estimativas assim obtidas nao diferiam significativamente daquelas 
em que nao havia qualquer ajustamento para a heterocedasticidade. Talvez esse resultado 
tivesse a ver apenas com o tamanho da amostra, que era de 25 mil observagoes. Com esse, 
os valores t estimados podem ser examinados quanto a significance estatfstica pelos proce- 
dimentos habituais de MQO, mesmo que o termo de erro assuma valores dicotomicos. O R 2 
estimado, 0,1 75, pode parecer baixo, mas, por ser uma amostra grande, ainda e significativo 
de acordo com o teste Fapresentado na Segao 8.4. Por fim, observamos como os autores 
misturaram variaveis quantitativas e qualitativas e como levaram em considera^ao os efeitos 
da intera^ao. 

Voltando a interpretagao dos resultados, vemos que cada coeficiente angular apresenta a 
taxa de variagao da probabilidade condicional de que um evento ocorra, dada uma unidade 
de alterafao no valor da variavel explanatoria. Por exemplo, o coeficiente de —0,2753 da 
variavel "acima de 65 anos" indica que, mantendo-se todos os demais fatores constantes, a 
probabilidade de participa^ao na forga de trabalho das mulheres desse grupo etario e cerca 
de 27% menor que na categoria-base das mulheres entre 22 e 54 anos. Do mesmo modo, o 
coeficiente da variavel "mais de 16 anos de estudo", 0,3061, indica que, tudo o mais manti- 
do constante, a probabilidade de que as mulheres com esse nfvel de escolaridade participem 
da for^a de trabalho e cerca de 31 % maior (em comparafao com as mulheres com menos de 
5 anos de estudo, a categoria-base). 

Agora considere o termo de intera^ao estado civil e idade. A tabela mostra que a 
probabilidade de participa^ao da for^a de trabalho e cerca de 29% para aquelas mulheres 
que nunca se casaram (comparada a categoria-base) e menor em cerca de 28% para 
aquelas que tern mais de 65 anos (novamente, em rela^ao a categoria-base). Mas a pro¬ 
babilidade de participag:ao de mulheres que nunca se casaran e tern 65 anos ou mais e 
cerca de 20% menor comparada com a categoria-base. Isso implica que as mulheres com 
65 anos ou mais, mas que nunca se casaram, tern mais probabilidade de participar da 
for^a de trabalho que aquelas de mesma faixa etaria e que sao casadas ou enquadradas 
em "outras" categorias. 

Seguindo este procedimento, o leitor pode interpretar facilmente o resto dos coeficientes 
dados na Tabela 15.3. Das informafoes, e facil obter as estimativas das probabilidades condi- 
cionais de participa^ao de mao de obra das varias categorias. Se queremos encontrar a pro¬ 
babilidade para mulheres casadas (outras), com 22 a 54 anos, com 12 a 15 anos de 
estudo, com taxa de desemprego de 2,5% a 3,4%, a mudan^a de emprego de 3,5% a 
6,49%, relativa a oportunidades de emprego de 74% e mais, e com RFMPS de $ 7.500 
ou mais, obtemos 

0,4368 + 0,1523 + 0,2231 - 0,0213 + 0,0301 + 0,0571 - 0,2455 = 0,6326 

Em outras palavras, a probabilidade da participagao na for^a de trabalho pelas mulheres 
com as caracterfsticas anteriores e estimada em cerca de 63%. 

( Continua ) 


9 COHEN, Malcolm S.; REA, JR., Samuel A.; LERMAN, Robert I. A micro model of labor supply. BLS Staff Paper 4, U.S. 
Department of Labor, 1970. 
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TABELA 15.3 

Regressao da 
participa§ao na 
for§a de trabalho 
de mulheres com 
22 anos ou mais, 
morando nas 96 
maiores areas 
estatfsticas 
metropolitanas 
padrao (AEMP) 
(variavel 

dependente: dentro 
ou fora da for§a de 
trabalho durante 
1966) 

Fonte: COHEN, 
Malcolm S.; REA, JR., 
Samuel A.; LERMAN, 
Robert I. A micro model 
of labor supply. BLS 
Staff Paper 4, 

U.S. Department of La¬ 
bor, 1970, Tabela F-6, p. 
212-213. 


Variavel explanatory 

Coeficiente 

Razao t 

Constante 

0,4368 

15,4 

Estado civil 

Casada, marido presente 

— 

— 

Casada, outros 

0,1523 

13,8 

Nunca se casou 

0,2915 

22,0 

Idade 

22-54 

— 

— 

55-64 

-0,0594 

-5,7 

65 ou mais 

-0,2753 

-9,0 

Anos de estudo 

0-4 

— 

— 

5-8 

0,1255 

5,8 

9-11 

0,1704 

7,9 

12-15 

0,2231 

10,6 

16 ou mais 

0,3061 

13,3 

Taxa de desemprego (1966), % 

Menos de 2,5 

— 

— 

2,5-3,4 

-0,0213 

-1,6 

3,5-4,0 

-0,0269 

-2,0 

4,1-5,0 

-0,0291 

-2,2 

5,1 ou mais 

-0,0311 

-2,4 

Mudanfa de emprego (1965-1966), % 

Menos de 3,5 

— 

— 

3,5-6,49 

0,0301 

3,2 

6,5 ou mais 

0,0529 

5,1 

Oportunidades relativas de emprego, % 

Menos de 62 

— 

— 

62-73,9 

0,0381 

3,2 

74 ou mais 

0,0571 

3,2 

RFMPS, $ 

Menos de 1.500 e negativa 

— 

— 

1.500-7.499 

-0,1451 

-15,4 

7.500 ou mais 

-0,2455 

-24,4 

Interagao (estado civil e idade) 

Estado civil Idade 

Outros 55-64 

-0,0406 

-2,1 

Outros 65 ou mais 

-0,1391 

-7,4 

Nunca se casou 55-64 

-0,1104 

-3,3 

Nunca se casou 65 ou mais 

-0,2045 

-6,4 

Interajao (idade e anos de estudos completos) 

Idade Anos 

65 ou mais 5-8 

-0,0885 

-2,8 

65 ou mais 9-11 

-0,0848 

-2,4 

65 ou mais 12-15 

-0,1288 

-4,0 

65 ou mais 16 ou mais 

-0,1628 

-3,6 


« 2 = 0,175 


Numero de observances = 25.153 


Nota: indica a categoria-base ou aquela omitida. 

RFMPS: renda familiar menos o proprio salario. 
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Com base em series temporais combinadas e dados de corte transversal de 200 tftulos Aa 
(alta qualidade) e Baa (qualidade media) no perfodo de 1961-1966, Joseph Cappelleri esti- 
mou o seguinte modelo de previsao da classifica^ao de tftulos. 10 

Yi = /Si + /32 X 2, + /S3X3, + /S4X4, + ^5X5/ + Uj 

em que Y, = 1 se a classifica^ao de tftulos for Aa (classifica^ao de Moody) 

= 0 se a classificagao de tftulo for Baa (classificagao de Moody) 

X 2 = razao de capitaliza^ao do endividamento, uma medida de alavancagem 
valor em dolar da dfvida de longo prazo ^ 

valor em dolar da capitaliza$ao total 
X3 = taxa de lucro 

valor do dolar apos o imposto de renda ^ 

valor em dolar das disponibilidades total Ifquida 

X 4 = desvio padrao da taxa de lucro, uma medida da variabilidade da taxa de lucro 
X s = ativos Ifquidos totais (milhares de dolares), uma medida de tamanho 

A priori, espera-se que f$ 2 e /S 4 sejam negativos (por que?) e espera-se que /i 3 e sejam posi- 
tivos. 

Apos a corre^ao da heterocedasticidade e a autocorrelafao de primeira ordem, Cappelleri 
obteve os seguintes resultados: * 11 

Yj = 0,6860 - 0,0179X| ( + 0,0486X3, + 0,0572X 4/ + 0,378(£-7)X s 

(0,1775) (0,0024) (0,0486) (0,0178) (0,039)(£-8) (15.3.1) 

R 2 = 0,6933 

Nota: 0,378(£-7) indica 0,0000000378 etc. 

Todos os coeficientes, exceto de X 4 , tern os sinais corretos. Deixamos aos estudantes de 
finangas explicar o sinal positivo do coeficiente da variabilidade da taxa de lucro, pois seria de 
esperar que, quanto maior a variabilidade nos lucres, menor a probabilidade de o tftulo obter 
uma classifica^ao Aa da Moody's, tudo o mais mantido constante. 

A interpretagao da regressao e direta. Por exemplo, 0,0486 ligada a X 3 indica que, 
mantendo os demais fatores iguais, um aumento de um ponto percentual na taxa de lu¬ 
cro levara em media a um aumento aproximado de 0,05 na probabilidade de um tftulo 
obter classifica^ao Aa. Do mesmo modo, se o quadrado do coeficiente alavancado au- 
menta em 1 unidade, a probabilidade de um tftulo ser classificado como um tftulo Aa 
diminui em 0,02. 


EXEMPLO 15.3 

Previsao de 
classificapao de 
um tftulo 


10 CAPPELLERI, Joseph. "Predicting a bond rating." Trabalho final nao publicado, C.U.N.Y. O modelo usado no 
artigo e uma modificagao do modelo empregado por POGUE, Thomas F.; SOLDOFSKY, Robert M. "What is in 
a bond rating 7" Journal of Financial and Quantitative Analysis, jun 1969. p. 201-228. 

11 Algumas das probabilidades estimadas antes de corrigir para heterocedasticidade foram negativas e algumas 
estavam acima de 1; nesses casos considerou-se que fossem iguais a 0,01 e 0,99, respectivamente, para facilitar 
o calculo dos pesos w ; . 
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EXEMPLO 15.4 

Quem tem cartao 
de debito? 


Como os cartoes de credito, os cartoes de debito agora sao bastante usados pelos consu- 
midores. Sao preferidos pelos fornecedores, porque, quando usamos um cartao de debito, o 
valor da compra e deduzido automaticamente de nossa conta corrente ou outra conta 
designada. Para verificar quais os fatores que determinam o uso do cartao de debito, obtive- 
mos dados de 60 clientes e consideramos o modelo a seguir: 12 

Yj = Pi + P 2 % 2 i + /83X3; + ^4X4, + u, 


em que Y = 1 para o portador do cartao de debito, 0 em caso contrario; X 2 = saldo bancario 
em dolares; X 3 = numero de transa^oes no caixa eletronico (CE); X 4 = 1 se os juros forem 
depositados em conta, 0 se nao forem depositados em conta. 

Uma vez que o modelo de probabilidade linear (MPL) mostra heterocedasticidade, apresen- 
tamos os resultados usuais de MQO corrigidos para heterocedasticidade em forma tabular. 


Variavel 

Constante 

Saldo 

CE 

juros 

R 2 


Coeficiente 

0,3631 

(0,1796)** 

0,00028** 

(0,00015) 

-0,0269 

(0,208) 

-0,3019** 

(0,1448) 

0,1056 


Coeficiente* 

0,3631 

(0,1604)** 

0,00028** 

(0,00014) 

-0,0269 

( 0 , 0202 ) 

-0,3019** 

(0,1353) 

0,1056 


Not a: * denota erros padrao corrigidos para heterocedasticidade. 
** significativo ao nivel de 5% . 


Quanto mais altos forem os juros pagos sobre os saldos em conta, menor a tendencia de ter um 
cartao de debito. Embora a variavel caixa eletronico nao seja significativa, note que ela tem sinal 
negativo. Talvez isso se deva as taxas cobradas de transagoes em caixas eletronicos. 

Nao ha uma grande diferen^a entre os erros padrao estimados com e sem corre^ao para 
heterocedasticidade. Para pouparmos espago, nao apresentamos os valores ajustados (as 
probabilidades estimadas), mas todos estavam dentro dos limites de 0 e 1. Entretanto, nao 
ha garantia de que isso acontecera em todos os casos. 


15.4 Alternativas ao MPL 

Como vimos, o MPL e afetado por varios problemas, como (1) a nao normalidade de u h (2) a he¬ 
terocedasticidade de Up (3) a possibilidade de Y s fora da faixa 0 — 1, e (4) os valores em geral mais 
baixos de R 2 . Mas esses problemas sao superaveis. Por exemplo, podemos usar os MQP para resolver 
o problema da heterocedasticidade ou aumentar o tamanho da amostra para minimizar o problema da 
nao normalidade. Ao apelarmos para os mfnimos quadrados restritos (MQR) ou para tecnicas de pro- 
grama?ao matematicas, podemos ate fazer as probabilidades estimadas ficarem no intervalo 0 — 1. 

Contudo, o problema fundamental do modelo de probabilidade linear e que ele nao e, logicamen- 
te, um modelo muito atraente, porque presupoe que P, = E( Y = 1 | X) aumenta linearmente com X, 
isto e, o efeito marginal ou incremental de X permanece constante o tempo todo. Em nosso exemplo 
da casa propria verificamos que quando X aumenta em uma unidade ($ 1.000), a probabilidade de 
possuir uma casa propria aumenta sempre na mesma quantia de 0,10. E isso acontece quer o nfvel 
de renda seja $ 8 mil, $ 10 mil, $ 18 mil ou $ 22 mil. Isso parece irrealista; na realidade se esperaria 
que Pj estivesse relacionado nao linearmente a Xf. com uma renda muito baixa uma familia nao tera 


12 Os dados usados na analise sao obtidos de LIND, Douglas A.; MARCHAL, William G.; MASON, Robert D. 
Statistical techniques in business and economics. 11. ed. McGraw-Hill, 2002, Apendice N, p. 775-776. Nao utili- 
zamos todas as variaveis empregadas pelos autores. 
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uma casa propria, mas com um nivel suficientemente alto de renda, por exemplo, X*, e muito prova- 
vel que tenha. Qualquer aumento de renda alem de X* teria pouco efeito sobre a probabilidade de 
possuir uma casa propria. Nos dois extremos da distribuigao de renda, a probabilidade de possuir 
uma moradia praticamente nao seria afetada por um pequeno aumento de renda. 

Portanto, o que precisamos e um modelo (probabilidade) que tenha esses dois aspectos: (1) quan- 
do Xj aumenta, P, = E(Y = I | X) aumenta, mas nunca fica fora do intervalo 0-1; e (2) a relagao entre 
Pj e Xj e nao linear, ou seja, “aproxima-se de zero a taxas cada vez menores quando A", fica menor e 
aproxima-se de 1 a taxas cada vez menores a medida que X l aumenta bastante”. 13 

Geometricamente, o modelo que queremos se pareceria com a Figura 15.2. Note nesse modelo 
que a probabilidade fica entre 0 e 1 e que ela varia nao linearmente com X. 

O leitor percebera que a curva sigmoide, ou em forma de S, da figura assemelha-se muito a fun- 
gao de distribuigao acumulada (FDA) de uma variavel aleatoria. 14 Portanto, pode-se usar a FDA 
para modelar regressoes em que a variavel de escolha e dicotomica, assumindo valores entre 0 e 1. 
A questao pratica agora e: que FDA? Embora todas as FDAs tenham forma de S, para cada variavel 
aleatoria ha uma unica FDA. Por razoes historicas e praticas, as FDAs escolhidas para representar 
esses modelos sao (1) logistica e (2) normal, a primeira dando origem ao modelo logit e a segunda 
ao modelo probit (ou normit). 

Embora um exame detalhado desses modelos esteja alem do escopo deste livro, indicaremos de 
modo informal como se calculam tais modelos e como podem ser interpretados. 


FIGURA 15.2 

Uma fungao de 
distribuigao 
acumulada (FDA). 


P 



15.5 O modelo logit 

Continuaremos com nosso exemplo de casa propria para explicar as ideias basicas que fun- 
damentam o modelo logit. Lembre-se de que, ao explicar a propriedade em relagao a renda, o 
MPL foi: 


Pi = Pi + Pi*, 


(15.5.1) 


13 ALDRICH, John; NELSON, Forrest, op. cit., p. 26. 

14 Como discutido no Apendice A, a FDA de uma variavel aleatoria X e apenas a probabilidade de que esta as- 
suma um valor menor ou igual a x 0 , em que x 0 e um valor numerico especificado de X. Em suma, F(X), a FDA 
de X e F (X = x 0 ) = P (X < x 0 ). 








Capftulo 15 Modelos de regressao de resposta qualitative! 551 


em que lea renda e P, = E(Y ■ = 1| X,) indica que a familia tem casa propria. Mas agora considere a 
seguinte representapao de casa propria: 


Pi = 


1 

1 + 


(15.5.2) 


Para facilitarmos a exposipao, escrevemos a Equapao (15.5.2) como 


Pi = 


1 

1 + e -z> 


e 


z 


1 + e z 


(15.5.3) 


em que Z, = + faXj. 

A Equapao (15.5.3) representa o que e conhecido como funcao de distrihuicao logistica 
(acumulada). 15 

E facil verificar que, como Z, varia de — oo a +°°, P l varia entre 0 e 1 e que P, esta relacionado nao 
linearmente a Z, (ou seja, X ,), satisfazendo os dois requisites considerados anteriormente. 16 Mas pa- 
rece que, ao satisfazermos esses requisites, criamos um problema de estimapao, porque P, e nao linear 
nao so em X, mas tambem no ft, como pode ser visto claramente na Equapao (15.5.2). Isso significa 
que nao podemos usar o procedimento conhecido de MQO para estimar os parametros. 17 Mas esse 
problema e mais aparente do que real, porque a Equapao (15.5.2) pode ser linearizada, o que pode ser 
mostrado a seguir. 

Se Pj, a probabilidade de ter casa propria, e dada pela Equapao (15.5.3), entao (1 — / J ,), a proba- 
bilidade de nao ter casa propria, e: 


1 ~ Pi = 


1 

1 + e Zi 


(15.5.4) 


Portanto, podemos escrever 


Pi 

1 -Pi 


1 + e z ‘ 

1 + e~ Zi 


(15.5.5) 


Agora, P/( 1 — Pj) e apenas a razao de chances em favor de ter uma casa propria menos a razao 
da probabilidade de que uma famflia possua a casa contra a probabilidade de que nao a possua. As- 
sim, Pj = 0,8 significa que as chances sao de 4 para 1 a favor de a familia ter casa propria. Se toma- 
mos o logaritmo natural da Equapao (15.5.5), obtemos um resultado muito interessante, a saber. 


Lj = In 



= z, 


= Pi + thx, 


(15.5.6) 


15 O modelo logfstico tem sido usado extensamente para analisar fenomenos de crescimento como populapao, 
PIB, oferta de moeda etc. Para detalhes teoricos e praticos dos modelos logit e probit, veja KRAMER, J. S. The 
logit model for economists. Londres: Edward Arnold Publishers, 1991; e MADDALA, C. S., op. cit. 

16 Note que, quando Z, -> + oo, e~ z 'tende a zero e quando Z, —» - oo, e~ Zi aumenta indefinidamente. Lembre-se 
de que e = 2,71828. 

17 Evidentemente, podenamos usartecnicas de estimapao nao lineares discutidas no Capftulo 14. Veja tambem a 
Sepao 15.8. 
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ou seja, L, o logaritmo da razao de chances, nao e apenas linear em X, mas tambem (do ponto de 
vista de estimagao), linear nos parametros. 18 L e chamado de logit, dal o nome modelo logit para 
aqueles como a Equagao (15.5.6). 

Veja estas caracteristicas do modelo logit: 

1. Quando P vai de 0 a 1 (quando Z varia de — co a +oo), o logit L vai de —as a +co. Embora as 
probabilidades fiquem (por necessidade) entre 0 e 1, os logits nao sao limitados. 

2. Embora L seja linear em X, as probabilidades em si nao sao. Esta propriedade contrasta com o 
modelo MPL (15.5.1), em que as probabilidades aumentam linearmente com X 19 

3. Embora tenhamos inclufdo apenas uma variavel X ou regressor no modelo anterior, podemos 
acrescentar tantos regressores quantos forem permitidos de acordo com a teoria que funda- 
menta esse procedimento. 

4. Se L, o logit, for positivo, significa que, quando o valor do(s) regressor(es) aumenta, as chances 
de o regressando ser igual a 1 (indicando que algum evento de interesse acontece) aumentam. 
Se L for negativo, as chances de o regressando ser igual a 1 diminuem a medida que o valor de 
X aumenta. Em outras palavras, o logit torna-se negativo e cada vez maior a medida que a razao 
de chances diminui de 1 para 0 e torna-se cada vez maior e positivo quando as chances aumen¬ 
tam infinitamente, a partir de l. 20 

5. Em termos mais formais, a interpretagao do modelo logit dada na Equagao (15.5.6) e a se- 
guinte: /3 2 , o coeficiente angular, mede a variagao em L para uma unidade de variagao em X, 
ou seja, indica quanto o logaritmo das chances favoraveis a posse da casa propria varia em 
resposta a mudangas de uma unidades, por exemplo, $ 1.000, na renda. O intercepto /Sj e o 
valor do logaritmo das chances favoraveis a posse da casa propria quando a renda e igual a 
zero. Como a maioria das interpretagoes de interceptos, esta pode nao ter qualquer sentido 
ffsico. 

6. De acordo com o nivel de renda, por exemplo, X*, se de fato quisermos calcular nao as chances 
favoraveis a posse da casa propria, mas a propria probabilidade de ser dono da casa, isso pode 
ser feito diretamente por meio da Equagao (15.5.3), uma vez que as estimativas de /3 X e fi 2 estao 
disponiveis. Isso, no entanto, levanta a questao mais importante: como estimamos /fi e (W! A 
resposta e apresentada na proxima segao. 

7. Enquanto o MPL supoe que P, esta linearmente relacionado a X„ o modelo logit supoe que o 
log da razao de chances esteja linearmente relacionado aX,. 


15.6 Estimagao do modelo logit 

Para fins de estimagao, escrevemos a Equagao (15.5.6) da seguinte maneira: 

Li = In -—J = P\ + p 2 Xt + iij (15.6.1) 

Discutiremos rapidamente as propriedades do termo de erro estocastico m,-. 


18 Lembre que a hipotese de linearidade dos MQO nao exige que a variavel X seja necessariamente linear. Sendo 
assim, podemos incluir X 2 , X 3 etc. como regressores no modelo. Para nossos objetivos, o fundamental e a line¬ 
aridade nos parametros. 

19 Usando calculo, podemos mostrar que dP/dX = fl 2 PO ~ P), q ue indica que a taxa de variagao da probabilida¬ 
de com relagao a X envolve nao so fi 2 , mas tambem o nfvel de probabilidade do qual a variagao e medida 
(veremos mais sobre o assunto na Segao 15.7). Observe que o efeito de uma unidade de variagao em X ; sobre 
P e maximo quando P = 0,5 e rmnimo quando P esta proximo de 0 ou 1. 

20 Esta observagao deve-se a David Garson. 
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Paracalcularmos a Equa^ao (15.6.1), precisamos, alem de X,, dos valores do regressando ou logit, 
Lj. Isso depende do tipo de dados que temos para analise. Distinguimos dois tipos de dados: (1) dados 
em nivel individual ou micro e (2) dados agrupados ou replicados. 

Dados individuals 

Se temos dados sobre cada familia, como no caso da Tabela 15.1, a estimativa por meio dos MQO 
da Equanao (15.6.1) e inviavel. E facil de verificar isso. Em termos dos dados apresentados na Tabela 
15.1, Pj = 1 se uma familia tem casa propria e P, = 0 se nao tem casa propria. Mas, se colocamos esses 
valores diretamente em logit L,. obtemos: 

se a familia tiver casa propria 
se a familia nao tiver casa propria 



Obviamente, essas expressoes nao fazem sentido. Se os dados estao no nivel individual ou micro, 
nao podemos estimar (15.6.1) pelo procedimento normal dos MQO. Nessa situaijao podemos recorrer 
ao metodo da maxima verossimilhan<;a (MV) para estimar os parametros. Embora ja tenhamos 
visto superficialmente esse metodo no apendice do Capitulo 4, sua aplicafao neste contexto sera 
examinada na Secjao 15A. 1 do Apendice 15A, que podera ser consultado por aqueles que desejam se 
aprofundar mais. 21 Programas especializados como MICROFIT, EViews, LIMDEP, SHAZAM, 
PC-GIVE, STATA e MINITAB possuem rotinas para estimar o modelo logit no nivel individual. 
Iremos ilustrar o uso do metodo da MV mais a frente neste capitulo. 


Dados agrupados ou replicados 

Agora considere os dados apresentados na Tabela 15.4. Ela apresenta dados sobre varias famflias 
agrupadas ou replicados (observances repetidas) de acordo com o nivel de renda e o numero de famf¬ 
lias que tem casa propria em cada nfvel de renda. Correspondendo a cada nfvel de renda X„ ha A,- 
famflias, n, entre as quais sao proprietaries de imoveis (n, < N,). Portanto, se calculamos 


Pt = 


nt_ 

N. 


(15.6.2) 


TABELA 15.4 

Dados hipoteticos 
sobre A, (renda), TV, 
(numero de famflias 
com renda X,), e n,- 
(numero de famflias 
que possuem casa 
propria) 


X 



(em $ mil) 

Ni 

n, 

6 

40 

8 

8 

50 

12 

10 

60 

18 

13 

80 

28 

15 

100 

45 

20 

70 

36 

25 

65 

39 

30 

50 

33 

35 

40 

30 

40 

25 

20 


21 Para uma discussao comparativamente simples da maxima verossimilhanfa no contexto do modelo logit, veja 
ALDRICH, John; NELSON, Forrest, op. cit., p. 49-54. Veja tambem, DEMARSI, Alfred. Logit modeling: practical 
applications. Newbury Park, California: Sage Publications, 1992. 
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afrequencia relativa, podemos usa-la como uma estimativa do verdadeiro P, correspondendo a cada 
X r Se Nj for bem grande, P, sera uma boa estimativa de P,. 21 Usando o P, estimado, podemos obter o 
logit estimado como 


^J = Pi + p 2 Xi (15.6.3) 

que sera uma estimativa boa do verdadeiro logit L, se o numero de observances A, em cada X, for ra- 
zoavelmente grande. 

Em resumo, tendo os dados agrupados ou replicados, como na Tabela 15.4, podemos obter os 
dados relativos a variavel dependente, os logits, para calendar o modelo (15.6.1). Serapossivel aplicar 
os MQO a (15.6.3) e estimar os parametros da maneira habitual? Nem sempre, pois ainda nao fala- 
mos nada a respeito das propriedades do termo de erro estocastico. E possivel demonstrar que, se N, 
for bem grande e se cada observayao em uma classe de renda X ,■ distribui-se independentemente como 
variavel binomial, entao 



u, 


N 


0, 


1 


NiPi{ 1 



(15.6.4) 


Uj segue a distribuiijao normal com media zero e variancia igual a 1 /[A', P, (1 — A*,)]. 23 

Portanto, como no caso do MPL, o termo de erro no modelo logit e heterocedastico. Em vez de 
usarmos o MQO, teremos de usar os minimos quadrados ponderados (MQP). Para fins empiricos no 
entanto, substituiremos a incognita P, por P, e usaremos 


NiPti 1 - Pi) 

como estimador de a 2 . 

Agora descreveremos as varias etapas para estimar a regressao logit (15.6.1): 


(15.6.5) 


1. Para cada nfvel de renda X, calcule a probabilidade de ter casa propria como P, = rij/Nj. 

2. Para cada X h obtenha o logit como: 24 


Lt = \n[Pi/(\ - Pi)] 


3. Para resolver o problema da heterocedasticidade, transforme a Equa£ao (15.6.1) da seguinte 
maneira: 24 


,/wiLi = P\Jwi + Pi^WjXi + 




(15.6.6) 


22 Recorde-se, da estatfstica elementar, que a probabilidade de um evento e o limite da frequencia relativa quan- 
do o tamanho da amostra torna-se infinitamente grande. 

23 Como mostra a teoria elementar da probabilidade, P,, a proporgao de sucessos (neste caso, a posse da casa 
propria) segue a distribuigao binomial com media igual ao verdadeiro P, e variancia igual a P ; (1 - P,-)/ N,; e 
quando N, aumenta indefinidamente, a distribuigao binomial aproxima-se da distribuigao normal. As proprie¬ 
dades distributivas de u, dadas na Equagao (15.6.4) decorrem dessa teoria basica. Para detalhes, veja THEIL, 
Henry. "On the relationships involving qualitative variables." American Journal of Sociology, jul. 1970. v. 76, p. 
103-154. 

24 Como P, = nj/N,, /.,■ pode ser expresso como t, = In n,/(N, - nj). Vale mencionar que, para evitar que P, assuma 
o valor de 0 ou 1, na pratica t,e medido como Li = ln(n,+ j)/(N,-- n, + J) = ln(P,+ 1 /2N,). Recomenda-se 
como regra pratica que N, seja no mfnimo 5 em cada valor de X;. Para maiores detalhes, veja COX, D. R. Analysis 
of binary data. Londres: Methuen, 1970, p. 33. 

25 Se estimamos a Equa^ao (15.6.1) desconsiderando a heterocedasticidade, os estimadores, embora nao tenden- 
ciosos, nao serao eficientes, como vimos no Capftulo 11. 
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que escrevemos como 


L \ = PiV™i+ P 2 X* + V, ( 15 . 6 . 7 ) 

em que os pesos w, = N, /, (1 — P,); Lf = L, transformado ou ponderado; X* = X, transfor- 
mado ou ponderado; e v, = termo de erro transformado. E facil verificar que o termo de erro 
transformado v, e homocedastico, tendo em mente que a variancia do erro original e a 2 = 
\/[N l P I (\ - P,)] . 

4. Estimamos a Equagao (15.6.6) por MQO - lembre-se de que os MQP sao os MQO sobre os 
dados transformados. Observe que na Equagao (15.6.6) nao ha termo de intercepto introduzido 
explicitamente (por que?). Teremos de usar a regressao que passa pela origem para calcular a 
Equagao (15.6.6). 

5. Estabelecemos intervalos de confianga e/ou testamos hipoteses dentro do habitual marco de refe¬ 
renda dos MQO, mas tendo em mente que todas as conclusoes so serdo rigorosamente validas se 
a amostra for suficientemente grande (por que?). No caso de pequenas amostras, os resultados 
estimados terao de ser interpretados com extremo cuidado. 


15.7 O modelo logit agrupado (Glogit): uni exemplo numerico 

Para ilustrarmos a teoria que acabamos de discutir, empregaremos os dados da Tabela 15.4. 
Como eles sao agrupados, o modelo logit baseado nesses dados sera chamado de modelo logit 
agrupado, glogit, para resumir. Os dados brutos necessarios e outros calculos relevantes para a 
implementagao do glogit estao na Tabela 15.5. Os resultados da regressao de minimos quadrados 
ponderados (15.6.7) baseados nos dados da Tabela 15.5 sao os seguintes: observe que nao ha in¬ 
tercepto na Equa?ao (15.6.7); daf o procedimento de regressao que passa pela origem e adequado 
neste caso. 


L] = - 1,59474 JWi + 0,07862X* 

ep = (0,11046) (0,00539) ( 15 . 7 . 1 ) 

t = (- 14,43619) (14,56675) R 2 = 0,9642 

O R 2 e o coeficiente de correla5ao elevado ao quadrado entre o L* observado e o estimado. if e X* sao 
os L, e Xj ponderados, como mostra a Equagao (15.6.6). Embora tenhamos apresentado os calculos do 
logit agrupado na Tabela 15.5 por razoes pedagogicas, isso pode ser feito facilmente utilizando o co- 
mando glogit (logit agrupado) no programa STATA. 

Interpreta^ao do modelo logit estimado 

Como interpretamos a Equagao (15.7.1)? Ha varias m5aneiras, algumas intuitivas e outras nao: 

Interpretagao do logit 

Como a Equagao (15.7.1) mostra, o coeficiente angular estimado sugere que, para o aumento de 
uma unidade ($ 1.000) na renda ponderada, o log ponderado das chances de ter casa propria aumenta 
em 0,08 unidade. Esta interpretagao mecanica, no entanto, nao e muito convincente. 

Interpretagao das chances 

Lembre-se de que L, = In [P,/( 1 — P,)]. Portanto, tomando o antilogaritmo do logit esti¬ 
mado, obtemos Pf{ 1 — P,), a razao de chances. Logo, tomando o antilogaritmo da Equagao 
(15.7.1), obtemos: 
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r i _ -1,59474^+0,07862^* 

i- % 

_ e - 1,59474^ . e 0,07862X* 


(15.7.2) 


Usando uma calculadora, podemos verificar facilmente que e°> 07862 = 1,08 1 7. Isso significa que, para 
uma unidade de aumento da renda ponderada, as chances (ponderadas) favoraveis a posse da casa 
propria aumentam em 1,0817 ou cerca de 8,17%. Em geral, se tomamos o antilogaritmo do j-esimo 
coeficiente angular (no caso em que haja mais de um regressor no modelo), subtraimos 1 dele e 
multiplicamos o resultado por 100, obtemos a variagao percentual das chances em favor de um au¬ 
mento de uma unidade no j-esimo regressor. 

Se voce quer efetuar a analise em termos do logit nao ponderado, basta dividir o L, estimado por 
y/wi. ATabela 15.6 apresenta os logits estimados ponderados e nao ponderados para cada observagao 
e alguns outros dados, que discutiremos em breve. 


Cdlculo de probabilidades 

Uma vez que a linguagem de logit e a razao de chances podem ser desconhecidas para alguns 
leitores, podemos calcular a probabilidade de ter casa propria em certo nivel de renda. Suponha que 
desejemos calcular essa probabilidade emX = 20 ($ 20.000). Inserindo esse valor na Equagao (15.7.1), 
obtemos L* = —0,09311 e, dividindo por v /w) = 4,181 6 (veja aTabela 15.5), obtemos L, = —0,02226. 
Portanto, ao nfvel de renda de $ 20.000, temos 


Portanto, 


-0,02199 = In 


Pi 


1 - P 



£-0,02199 = 097325 


Resolvendo isso para 


e -0,02199 
1 + e-0,02199 


TABELA 15.6 

L*, X*, L* estimado, 
probabilidade e 
variagao da 
probabilidade* 

L* 

-3,50710 
-3,48070 
- 3,48070 

X* 

15,1788 

24,15920 

35,49600 

L* Estimado 

-2,84096 

-2,91648 

-2,86988 

Logit 

-1,12299 

-0,96575 

-0,80850 

Probabilidade, 

P 

0,24545 

0,27572 

0,30821 

Variagao 

da probabilidade 1 

0,01456 

0,01570 

0,01676 


-2,64070 

55,45930 

-2,44293 

-0,57263 

0,36063 

0,01813 


-0,99850 

74,62350 

-2,06652 

-0,41538 

0,39762 

0,01883 


0,16730 

83,65060 

-0,09311 

-0,02226 

0,49443 

0,01965 


1,60120 

98,74250 

1,46472 

0,37984 

0,59166 

0,01899 


2,22118 

100,48800 

2,55896 

0,76396 

0,68221 

0,01 704 


3,00860 

95.84050 

3,16794 

1,15677 

0,76074 

0,01431 


2,77260 

80,00000 

3,10038 

1,55019 

0,82494 

0,01135 


*Lstar e Xstar sao da Tabela 15.5. Logit e o logit nao ponderado. Probabilidade e a probabilidade estimada de ter casa propria. 
Variagao da probabilidade por unidade de alteragao na renda. 
tCalculado a partir de jS 2 P(l — P) = 0,07862P(1 — P). 








558 


Parte tres 


Topicos em econometria 


o leitor pode ver que a probabilidade estimada e 0,4945. Ou seja, dada a renda de $ 20 mil, a proba- 
bilidade de uma familia ter casa propria e de aproximadamente 49%. A Tabela 15.6 apresenta as 
probabilidades calculadas nos varios niveis de renda. Como mostra a tabela, a probabilidade de ter casa 
propria aumenta com a renda, mas nao linearlmente com o modelo de probabilidade linear. 


Calculo da variagao da probabilidade 

De acordo com a Tabela 15.6, a probabilidade de ter casa propria depende do nivel de renda. 
Como calculamos a taxa de variagao das probabilidades a medida que a renda muda? Segundo a nota 
de rodape 19, isso nao depende apenas do coeficiente angular estimado /C, mas tambem do nivel de 
probabilidade do qual a variagao e medida; esta ultima depende, obviamente, do nivel de renda em 
que a probabilidade e calculada. 

Para ilustrarmos, suponha que desejemos medir a variagao na probabilidade de termos uma casa 
com renda no nivel de $ 20 mil. Da nota de rodape 19, a variagao na probabilidade para uma unidade 
aumentar do nivel 20 (mil) e: yS(l — P)P = 0,07862(0,05056)(0,4944) = 0,01965. 

Fica como exercicio para o leitor mostrar que, ao nivel de renda de $ 40 mil, a variagao na proba¬ 
bilidade e de 0,01135. A Tabela 15.6 apresenta a variagao na probabilidade de ter casa propria em 
varios niveis de renda; essas probabilidades tambem estao na Figura 15.3. 

Para concluirmos nossa discussao do modelo glogit, apresentamos os resultados com base nos 
MQO, ou regressao nao ponderada, para o exemplo relativo a casa propria: 


Li= - 1,6587 + 0,0792X, 

ep = (0,0958) (0,0041) 

t= (-17,32) (19,11) r 2 = 0,9786 


(15.7.3) 


A comparagao dessa regressao com a regressao de minimos quadrados ponderados da Equagao 
(15.7.1) e deixada para o leitor. 


15.8 O modelo logit para dados nao agrupados ou individuals 

Para iniciar, considere os dados da Tabela 15.7. Sendo Y = 1 se a nota final de um aluno na prova 
do curso de microeconomia fosse Ac K= 0 sc o conceito final fosse B ou C, Spector e Mazzeo usaram 
a pontuagao media (GPA), o TUCE e o Sistema de Instrugao Personalizado (PSI) como previsores do 
conceito dado para classificar o aproveitamento do aluno. O modelo logit pode ser escrito como: 


FIGURA 15.3 

Variagao na 
probabilidade em 
relagao a renda. 


T3 

X5 



0,020 

0,019 

0,018 

0,017 

0,016 

0,015 

0,014 

0,013 

0,012 

0,011 


o 

o 


10 


o 

o 


l 

15 


o 


o 


20 25 


o 


o 


i!i 

30 35 40 45 


X, renda, $, mil 





Capftulo 15 Modelos de regressao de resposta qualitativa 559 


TABELA 15.7 Dados sobre o efeito do Sistema de Instru^ao Personalizado (PSI) em pontos (que indicam o aproveitamento do 
aluno) 


Observagao 

GPA 

Pontos 

TUCE 

Pontos 

PSI 

Pontos 

Conceito Observagao 

GPA 

Pontos 

TUCE 

Pontos 

PSI 

Pontos 

Conceito 

1 

2,66 

20 

0 

0 

C 

17 

2,75 

25 

0 

0 

C 

2 

2,89 

22 

0 

0 

B 

18 

2,83 

19 

0 

0 

C 

3 

3,28 

24 

0 

0 

B 

19 

3,12 

23 

1 

0 

B 

4 

2,92 

12 

0 

0 

B 

20 

3,16 

25 

1 

1 

A 

5 

4,00 

21 

0 

1 

A 

21 

2,06 

22 

1 

0 

C 

6 

2,86 

17 

0 

0 

B 

22 

3,62 

28 

1 

1 

A 

7 

2,76 

17 

0 

0 

B 

23 

2,89 

14 

1 

0 

C 

8 

2,87 

21 

0 

0 

B 

24 

3,51 

26 

1 

0 

B 

9 

3,03 

25 

0 

0 

C 

25 

3,54 

24 

1 

1 

A 

10 

3,92 

29 

0 

1 

A 

26 

2,83 

27 

1 

1 

A 

11 

2,63 

20 

0 

0 

C 

27 

3,39 

17 

1 

1 

A 

12 

3,32 

23 

0 

0 

B 

28 

2,67 

24 

1 

0 

B 

13 

3,57 

23 

0 

0 

B 

29 

3,65 

21 

1 

1 

A 

14 

3,26 

25 

0 

1 

A 

30 

4,00 

23 

1 

1 

A 

15 

3,53 

26 

0 

0 

B 

31 

3,10 

21 

1 

0 

C 

16 

2,74 

19 

0 

0 

B 

32 

2,39 

19 

1 

1 

A 


Notas: Y = 1 se o conceito final for A 
= 0 se for B ou C 

TUCE = pontuagao em prova dada no irncio do semestre para testar o conhecimento inicial de macroeconomia 
PSI = 1 se um novo metodo de ensino for usado 
= 0 em caso contrario 
GPA = media de pontos no irncio do curso 

Fonte: SPECTOR, L.; MAZZEO, M. “Probit analysis and economic education.” Journal of Economic Education, v. 11, p. 37—44, 1980. 


ft = 


In 


Pi 

1- Pi 


ft + ftGPA ,• + ft TUCE,- + ftPSI,- + Uj 


(15.8.1) 


Como observado na Segao 15.6, nao podemos apenas colocar ft = 1 se uma famflia possui casa 
propria e zero se nao possui. No caso, nem os MQO nem os mmimos quadrados ponderados (MQP) 
sao liteis. Precisamos recorrer a procedimentos de estimagao nao lineares usando o metodo da maxi¬ 
ma verossimilhanga. Os detalhes desse metodo sao apresentados na Segao 15A. 1 do Apendice 15A. 
Como a maioria dos programas estatfsticos modernos inclui rotinas para estimar modelos logit com 
base em dados nao agrupados, apresentaremos os resultados do modelo (15.8.1) empregando os da¬ 
dos da Tabela 15.7 e mostraremos como interpretar os resultados, apresentados de forma tabular 
na Tabela 15.8 e obtidos com auxilio do Eviews 6. Antes de interpretarmos os resultados, fagamos 
algumas observagoes gerais. 


1. Por estarmos usando o metodo de maxima verossimilhanga, que em geral e um metodo de 
amostras grandes, os erros padrao estimados sao assintoticos. 

2. Como resultado, em vez de utilizarmos a estatistica t para avaliar a significance estatistica 
de um coeficiente, usamos a estatistica Z (normal). Portanto, as inferences baseiam-se na 
tabela normal. Lembre-se de que, se o tamanho da amostra for razoavelmente grande, a 
disribuigao t convergira para a distribuigao normal. 

3. Como observado anteriormente, a medida convencional da qualidade do ajustamento, R 2 , 
nao e particularmente significativa nos modelos com regressando binario. Medidas seme- 
lhantes a R 2 , chamadas pseudo R 2 , sao dispomveis, e ha uma variedade delas. 26 O EViews 
apresenta uma dessas medidas, o R 2 de McFadden, denotado por cujo valor em nossos 


26 Para uma discussao acessfvel, veja LONG, J. Scott. Regression models for categorical and limited dependent variables. 
Newbury Park, California: Sage Publications, 1997, p. 102-113. 
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TABELA 15.8 

Regressao de dados 
da Equa§ao (15.8.1) 


Dependent Variable: Grade 
Method: ML-Binary Logit 

Convergence achieved after 5 iterations 


Variable 

Coefficient 

Std. Error 

Z Statistic 

Probability 

C 

-13.0213 

4.931 

-2.6405 

0.0082 

GPA 

2.8261 

1.2629 

2.2377 

0.0252 

TUCE 

0.0951 

0.1415 

0.67223 

0.5014 

PSI 

2.3786 

1.0645 

2.2345 

0.0255 


McFadden R 2 = 0.3740 LR statistic (3 df) = 15.40419 


exemplos e 0,3 740. 27 Como R 2 , /?m c f tambem varia entre 0 e 1. Outra medida comparativa- 
mente simples da qualidade do ajustamento e o count R 2 , definido como: 


, numero de previsoes corretas 

Count/? 2 = --- 

numero total de observa^ao 


(15.8.2) 


Uma vez que o regressando no modelo logit assume valor 1 ou zero, se a probabilidade prevista 
for maior que 0,5, classificamos como 1, mas, se for menor que 0,5, classificamos como 0. Entao, 
contamos o numero de previsoes corretas e calculamos o R 2 como dado na Equa£ao (15.8.2). Apre- 
sentaremos um rapido exemplo disso. 

Deve-se notar, no entanto, que, em modelos de regressando binario, a qualidade do ajustamento e 
de importancia secundaria. O que importa sao os sinais esperados dos coeficientes de regressao e sua 
significance estatistica e/ou pratica. 

4. Para testar a hipotese nula de que todos os coeficientes angulares sao simultaneamente 
iguais a zero, o equivalente do teste F para o modelo de regressao linear e a estatistica da ra- 
zao de verossimilhan^a. Dada a hipotese nula, a estatistica da razao de verossimilhan 5 a (RV) 
segue a distribu^ao de x 2 com o numero de graus de liberdade igual ao numero de variaveis 
explanatorias, tres nesse exemplo. ( Nota : o termo de intercepto e excluido para calcular os 
graus de liberdade.) 

Agora vamos interpretar os resultados de regressao dados na Equa£ao (15.8.1). Cada coeficiente 
angular nessa equac^ao e um coeficiente angular parcial e mede a varia£ao no logit estimado para uma 
variaqiao unitaria do valor do regressor dado (mantendo-se tudo o mais constante). O coeficiente GPA 
de 2,8261 indica que, mantidas as demais variaveis constantes, se o GPA aumenta em uma unidade, 
o logit estimado aumenta, em media, cerca de 2,83 unidades, sugerindo uma rela£ao positiva entre os 
dois. Como se ve, todos os demais regressores tem um efeito positivo sobre o logit, embora, estatis- 
ticamente, o efeito de TUCE nao seja significativo. Contudo, todos os regressores em conjunto tem 
um impacto significativo na nota final, ja que a estatistica RV e 15,40 cujo valor/; e cerca de 0,0015, 
que e muito pequeno. 

Como observado, uma interpretac/ao mais significativa esta em termos de chances, que sao obti- 
das tomando-se o antilogaritmo dos varios coeficientes angulares. Se tomarmos o antilogaritmo do 
coeficiente PSI de 2,3786 obteremos 10,7897 (« e 2 - 3786 ). Isso sugere que os estudantes submetidos ao 
novo metodo de ensino tem dez vezes mais chances de obterem A do que aqueles que nao sao subme¬ 
tidos a ele, tudo o mais mantido constante. 


27 Tecnicamente, isto e definido como: 1 — (LLF ur /LLF r ), em que LLF ur e a fungao logarftmica nao restrita de veros- 
similhanga na qual estao inclufdos todos os regressores do modelo, e LLF r e a fungao logarftmica restrita de 
verossimilhanfa na qual esta inclufdo apenas o intercepto. Conceitualmente, LLF ur e equivalente a SQR e LLF r e 
o equivalente de SQT no modelo de regresao linear. 
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Imagine que desejemos calcular a probabilidade efetiva de um estudante obter conceito A. Con- 
sidere o caso do estudante numero 10 na Tabela 15.7. Colocando os dados observados desse estudan¬ 
te no modelo estimado logit da Tabela 15.8, o leitor pode verificar que o valor estimado do logit para 
esse estudante e 0,8178. Com auxilio da Equa$ao (15.5.2), o leitor constatara facilmente que a proba¬ 
bilidade estimada e de 0,69351. Como a nota final efetiva desse estudante foi um A e como nosso 
modelo logit atribui uma probabilidade igual a 1 para um estudante que receba A, a probabilidade 
estimada de 0,69351 nao e exatamente igual a 1, mas esta proxima. 

Lembre-se do count R 2 definido anteriormente. A Tabela 15.9 da os valores efetivo e previsto 
do regressando para nosso exemplo ilustrativo. Dela podemos observar que, de 32 observa 9 oes, 
havia seis previsoes incorretas (os estudantes 14, 19, 24, 26, 31 e 32). Desse modo, o valor do 
count R 2 e 26/32 = 0,8125, enquanto o valor R 2 de McFadden e 0,3740. Embora esses dois valo¬ 
res nao sejam diretamente comparaveis, eles dao ideia das ordens de grandeza. Alem disso, nao 
devemos exagerar a importancia da qualidade do ajustamento em modelos em que o regressando 
e dicotomico. 


TABELA 15.9 

Valores efetivo e 
observado baseados 
na regressao da 
Tabela 15.8 


Observafao 

Real 

Estimado 

1 

0 

0,02658 

2 

0 

0,05950 

3 

0 

0,18726 

4 

0 

0,02590 

5 

1 

0,56989 

6 

0 

0,03486 

7 

0 

0,02650 

8 

0 

0,05156 

9 

0 

0,11113 

10 

1 

0,69351 

11 

0 

0,02447 

12 

0 

0,19000 

13 

0 

0,32224 

*14 

1 

0,19321 

15 

0 

0,36099 

16 

0 

0,03018 

17 

0 

0,05363 

18 

0 

0,03859 

*19 

0 

0,58987 

20 

1 

0,66079 

21 

0 

0,06138 

22 

1 

0,90485 

23 

0 

0,24177 

*24 

0 

0,85209 

25 

1 

0,83829 

*26 

1 

0,48113 

27 

1 

0,63542 

28 

0 

0,30722 

29 

1 

0,841 70 

30 

1 

0,94534 

*31 

0 

0,52912 

*32 

1 

0,11103 


Residuo Representa^ao grafica 

-0,02658 
-0,05950 
-0,18726 
-0,02590 
0,43011 
-0,03486 
-0,02650 
-0,05156 
-0,11113 
0,30649 
-0,02447 
-0,19000 
-0,32224 
0,80679 
-0,36099 
-0,03018 
-0,05363 
-0,03859 
-0,58987 
0,33921 
-0,06138 
0,09515 
-0,24177 
-0,85209 
0,16171 
0,51887 
0,36458 
-0,30722 
0,15830 
0,05466 
-0,52912 
0,88897 



* Previsoes incorretas. 
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EXEMPLO 15.5 

Quem tem cartao 
de debito? 
Analise logit 


Ja vimos os resultados do modelo de probabilidade linear aplicados aos dados de car¬ 
tao de debito, entao vamos ver como o modelo logit funciona. Os resultados sao os se- 
guintes: 

Dependent Variable: DEBIT 

Method: ML-Binary Logit (Quadratic hill climbing) 

Sample: 1-60 

Included observations: 60 

Convergence achieved after 4 iterations 

Covariance matrix computed using second derivatives 


Variable 

Coefficient 

Std. Error 

z-Statistic 

Prob. 

c 

-0.574900 

0.785787 

-0.731624 

0.4644 

Balance 

0.001248 

0.000697 

1.789897 

0.0735 

ATM 

-0.120225 

0.093984 

-1.279205 

0.2008 

Interest 

-1.352086 

0.680988 

-1.985478 

0.0471 


McFadden R-squared 

0.080471 

Mean dependent var. 

0.433333 

S.D. dependent var. 

0.499717 

S.E. of regression 

0.486274 

Akaike info criterion 

1.391675 

Sum squared resid. 

13.24192 

Schwarz criterion 

1.531298 

Log likelihood 

-37.75024 

Hannan-Quinn criter. 

1.446289 

Restr. log likelihood 

-41.05391 

LR statistic 

6.607325 

Avg. log likelihood 

-0.629171 

Prob. (LR statistic) 

0.085525 



Obs. with Dep = 0 

34 

Total obs. 

60 

Obs. with Dep = 1 

26 




O sinal positivo do Saldo e os sinais negativos do Caixa Eletronico e da Taxa de Juros sao 
parecidos com o MPL, embora nao possamos comparar diretamente os dois. A interpreta^ao 
dos coeficientes no modelo logit e diferente daquela do MPL. Por exemplo, se a taxa de juros 
sobe em 1 ponto percentual, o logit diminui em cerca de 1,35, mantendo-se as demais varia- 
veis constantes. Se tomamos o antilogaritmo de -1,352086, obtemos aproximadamente 
0,2587. Isso significa que, se a taxa de juros for paga sobre o saldo bancario, em media ape- 
nas um quarto dos clientes provavelmente tem cartoes de credito. 

Da estatfstica RV estimada vemos que coletivamente as tres variaveis sao significativas do 
ponto de vista estatfstico, aproximadamente ao nfvel de 8,5%. Se usarmos o nfvel convencio- 
nal de 5% de significance, essas variaveis terao significance marginal. O valor R 2 de McFadden 
e bem baixo. Usando os dados, o leitor pode descobrir o valor do count R 2 . 

Como observado, diferentemente do MPL, os coeficientes angulares nao nos dao a taxa 
de varia^ao da probabilidade para uma unidade de variagao no regressor. Temos de calcula-los 
como mostra a Tabela 1 5.6. Felizmente, essa tarefa manual nao e necessaria, pois progra- 
mas estatfsticos como o STATA podem fazer isso. Para nosso exemplo, os resultados sao 
os seguintes: 

Efeitos marginais apos o logit 


Y = Pr(debito) (previsto) 
= 0,42512423 


Variable 

dy/dx 

Std. Error 

z 

p > I Z 1 

[ 95% C 

:.i. ] 

X 

Balance 1 

.000305 

.00017 

1.79 

0.073 

-.000029 

.000639 

1499.87 

Interest* 1 

-.2993972 

. 12919 

-2.32 

0.020 

-.552595 

-.046199 

.266667 

ATM | 

- . 0293822 

. 02297 

-1.28 

0.201 

-.074396 

.015631 

10.3 


*dy/dx representa a variagao discreta da variavel dummy de 0 para 1. 

( Continua ) 
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EXEMPLO 15.5 O coeficiente de 0,000305 sugere que os clientes com saldos mais altos tem uma proba- 
(, Continuagdo ) bilidade 0,03% maior de possuir cartao de debito, mas, se a taxa de juros subir em 1 ponto 

percentual, a probabilidade de terem cartao de debito cai 30%. O coeficiente do caixa eletro- 
nico, embora estatisticamente insignificante, sugere que, se as transagoes em caixa eletonico 
subirem em uma unidade, a probabilidade de ter cartao de debito abaixa cerca de 2,9%. 


15.9 O modelo probit 

Como observamos, para explicar o comportamento de uma variavel dependente dicotomica tere- 
mos de usaruma fungao de distribuigao acumulada (FDA) escolhida adequadamente. O modelo logit 
usa a fungao logfstica acumulada, como mostra a Equagao (15.5.2). Mas esta nao e a unica FDA que 
podemos utilizar. Em algumas aplicagoes, a FDA normal tem sido util. O modelo de estimagao que 
emerge da FDA normal 28 e conhecido como modelo probit, embora as vezes tambem seja conhecido 
como modelo normit. Em prinefpio se poderia substituir a FDA normal em lugar da FDA logfstica 
na Equagao (15.5.2) e continuar como na Segao 16.5. Em vez de seguirmos essa rotina, apresentare- 
mos o modelo probit com base na teoria da utilidade ou na perspectiva da escolha racional sobre o 
comportamento, desenvolvida por McFadden. 29 

Para motivarmos o modelo probit, consideremos que, em nosso exemplo da casa propria, a deci- 
sao da /-esima famflia de ter uma casa propria ou nao depende de um fndice de utilidade nao obser- 
vavel Ij (tambem conhecido como variavel latente), que e determinado por uma ou mais variaveis 
explanatorias, por exemplo, a renda X n de tal modo que, quanto maior for o valor do fndice /,-, maior 
a probabilidade de uma familia ter uma casa. Expressamos o indice /,■ como 

li = Pi + PiXi (15.9.1) 


em que X, e a renda da /-esima famflia. 

Como o fndice (nao observavel) relaciona-se com a decisao real de ter uma casa? Como antes, 
seja Y = 1 se a famflia tiver uma casa e Y = 0 se nao tiver. Agora, e razoavel supor que ha um nivel 
critico ou limiar do fndice, que chamamos de /*, tal que, se /, exceder /*, a famflia tera uma casa, 
caso contrario, nao tera. O limiar /*, como /,, nao e observavel, mas, se supusermos que ele se distri- 
bui normalmente com a mesma media e variancia, e possfvel nao apenas estimar os parametros do 
fndice dado em (15.9.1), mas obter algumas informagoes sobre o proprio fndice nao observavel. O 
calculo e apresentado a seguir. 

Dada a hipotese da normalidade, a probabilidade de que /, seja menor ou igual a /,■ pode ser cal- 
culada por meio da FDA normal padronizada como: 30 

Pi = P(Y = 11 X) = P(I* < /,) = P(Z, + foXt) = FQ 3 , + fhXi) ( 15 . 9 . 2 ) 


28 Veja o Apendice A para uma discussao da FDA normal. Para uma breve explicagao, se uma variavel X segue a 
distribuigao normal com media n e variancia a 2 , sua FDA e 

f(X)= 1 p -(X-m) 2 /2<t 2 

-yj2o 2 n 

e sua FDA e, 

F(X) = f X ° 1 p -V<-h) 2 /2P 

J ■ ^j2.a 2 Tz 

em que X 0 e um valor especffico de X. 

29 McFADDEN, D. "Conditional logit analysis of qualitative choice behavior." In: ZAREMBKA, P. (Ed.). Frontiers in 
econometrics. Nova York: Academic Press, 1973. 

30 Uma distribuigao normal com media zero e variancia unitaria ( = 1) e conhecida como uma variavel padrao ou 
padronizada ou normal padrao (veja o Apendice A). 
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FIGURA 15.4 


Pi=m 


P i = F(I i ) 



(a) 


(b) 


em que P(Y — 1 | X) indica a probabilidade de um evento ocorrer dados o(s) valor(es) da(s) variavel(is) 
explanatoria(s) X, e em que Z, e a variavel normal padrao, isto e, Z ~ N{ 0, a 2 ). Fea FDA normal 
padrao, neste contexto escrita explicitamente da seguinte forma: 


F(It) = 


Como P representa a probabilidade de um evento ocorrer, no caso a probabilidade de ter uma casa 
propria, ele e medido pela area da curva normal padrao de —oo a /, como mostra a Figura 15.4a. 

Agora, para obtermos informa 5 oes sobre /„ o indice de utilidade, bem como sobre /i, e /T, toma- 
mos o inverso da Equacjao (15.9.2) para obter: 


/' 
1 f 

yfljt J-, 


-* 2 ' 2 dz 


Ih + lhXi 


(15.9.3) 


- :1/1 dz 


It - - F-\P t ) 

= Pi + foXi 


(15.9.4) 


em que F 1 e o inverso da FDA normal. O significado de tudo isso fica claro na Figura 15.4. No painel 
(a) da figura obtemos da ordenada a probabilidade (acumulada) de ter casa propria dado If < /,-, en- 
quanto no painel (b) obtemos da abscissa o valor de /, dado o valor de P h que e apenas o inverso da 
primeira. 

Mas como obtemos concretamente o mdice /, e estimamos /fi e /3 2 ? Como no caso do modelo logit, 
a resposta depende de termos dados agrupados ou nao agrupados. Consideraremos os dois casos in- 
dividualmente. 


Estima^ao do probit com dados agrupados: gprobit 

Usaremos os mesmos dados que os utilizados para o glogit, da Tabela 15.4. Como ja temos P h a 
frequencia relativa (a medida aplicada da probabilidade) de ter uma casa propria com varios m'veis de 
renda como mostra a Tabela 15.5, podemos usa-la para obter /, da FDA normal, como mostra a Tabela 
15.10, ou da Figura 15.5. 
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TABELA 15.10 

Estimando o rndice /, 
da FDA normal 
padrao 


Pi 

/;= F\Pi) 

0,20 

-0,8416 

0,24 

-0,7063 

0,30 

-0,5244 

0,35 

-0,3853 

0,45 

-0,1257 

0,51 

0,0251 

0,60 

0,2533 

0,66 

0,4125 

0,75 

0,6745 

0,80 

0,8416 


Notas: (I) sao extraldos da Tabela 15.5; (2) /, sao estimativas da FDA normal padrao. 


FIGURA 15.5 

FDA normal. 


Uma vez que estimamos /,, estimar fi , e /T e relativamente simples, como mostramos rapidamen- 
te. Observe que na linguagem da analise probit o rndice de utilidade nao observavel /, e conhecido 
como desvio normal equivalente (dne) ou simplesmente normit. Uma vez que o desvio normal 
equivalente ou I, sera negativo sempre que P, < 0,5, na pratica o numero 5 e adicionado ao desvio e 
o resultado e chamado de probit. 


1 



EXEMPLO 15.6 

Ilustragao do 
gprobit 
utilizando o 
exemplo da casa 
propria 


Continuaremos com o exemplo da casa propria. Ja apresentamos os resultados do mode- 
lo glogit referente a este exemplo. O resultado do probit agrupado (gprobit) com os mesmos 
dados e o seguinte: 

Com os desvios normais equivalentes (= /) dados na Tabela 15.10, os resultados da re¬ 
gressao sao os mostrados na Tabela 15.11. 31 Os resultados da regressao baseados nos probits 
(= desvios normais equivalentes + 5) sao apresentados na Tabela 15.12. 

Com exce^ao do termo de intercepto, esses resultados sao identicos aos da tabela ante¬ 
rior, mas isso nao deveria ser uma surpresa. (Por que?) 


TABELA 15.11 

Dependent Variable: I 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Probability 

C 

-1.0166 

0.0572 

-17.7473 

1.0397E-07 

Income 

0.04846 

0.00247 

19.5585 

4.8547E-08 


J? 2 = 0.97951 

Durbin-Watson statistic=0.91384 


( Continua) 


31 Os resultados a seguir nao sao correlacionados para heterocedasticidade. Veja o Exerddo 15.12 para o proce- 
dimento adequado usado na corre^ao da heterocedasticidade. 
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EXEMPLO 15.6 

(' Continuagao ) 

TABELA 15.12 


Dependent Variable: Probit 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Probability 

C 

3.9833 

0.05728 

69.5336 

2.03737E-12 

Income 

0.04846 

0.00247 

19.5585 

4.8547E-08 


R 2 = 0.9795 

Durbin-Watson statistic 

= 0.9138 


Nola: estes resultados nao estao corrigidos para heterocedasticidade (veja o Exercicio 15.12). 


Interpretagao das estimativas do probit na Tabela 15.11 

Como interpretamos os resultados anteriores? Suponha que desejemos encontrar o efeito de uma 
variagao unitaria em X (renda medida em milhares de dolares) sobre a probabilidade de Y = 1, ou seja, 
uma famflia comprar uma casa. Para tanto, veja a Equagao (15.9.2). Queremos derivar essa fungao com 
relagao a X (a taxa de variagao da probabilidade em relagao a renda). Essa derivada e: 


jY = /(/Si + fhX,)fh (15.9.5) 32 

em quc/(/), + /TX,) e a fungao de densidade de probabilidade normal padrao em [ J > { + /TX,. Como 
voce percebera, essa avaliagao dependent do valor das variaveis X. Vamos tomar o valor de X da Tabela 
15.5, por exemplo, X = 6 (milhares de dolares). Usando os valores estimados dos parametros dados na 
Tabela 15.11, queremos encontrar a fungao de densidade normal em/[—1,0166 + 0,04846(6)] = 
/(—0,72548). Se nos referirmos as tabelas de distribuigao normal, verificamos que, paraZ = —0,72548, 
a densidade normal e cerca de 0,3066. 33 Agora, multiplicando esse valor pelo coeficiente angular de 
0,04846, obtemos 0,01485. Isso indica que, comegando com a renda de $ 6 mil, se a renda subir $ 1 
mil, a probabilidade de uma familia comprar uma casa subira cerca de 1,4%. (Compare este resulta- 
do com o da Tabela 15.6.) 

Como podemos ver, comparado com os modelos logit e MPL, o calculo de variagoes na probabi¬ 
lidade usando o modelo probit e um pouco trabalhoso. 

Em vez de calcular as variagoes na probabilidade, suponha que voce queira encontrar as probabi- 
lidades estimadas do modelo gprobit. Isso pode ser feito facilmente. Usando-se os dados da Tabela 
15.11 e inserindo os valores de X da Tabela 15.5, o leitor pode verificar que os valores dne (ate dois 
digitos) sao os seguintes: 


X 6 8 10 13 15 20 25 30 35 40 

dneestimado -0,72 -0,63 -0,53 -0,39 -0,29 -0,05 0,19 0,43 0,68 0,92 


Agora, programas como MINITAB podem calcular facilmente as probabilidades (acumuladas) 
associadas aos varios dne. Por exemplo, correspondendo a um valor dne —0,63, a probabilidade es- 
timada e de 0,2647 e, correspondendo a um valor dne de 0,43, a probabilidade estimada e de 0,6691. 
Se compararmos essas estimativas com os valores reais dados na Tabela 15.5, verificaremos que as 

32 Usamos a regra das derivadas em cadeia: 

dP; dF(t) dt 
dXi = dt ' dX 

em que t = di + foX,-. 

33 Note que o padrao normal Z pode variar de -oo a +oo, mas a fungao de densidade f (Z) e sempre positiva. 
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duas estao bem proximas, sugerindo que o modelo ajustado e bom. Graficamente, o que fizemos ja 
foi apresentado na Figura 15.4. 

O modelo probit para dados nao agrupados ou individuals 

Retomaremos a Tabela 15.7, em que se apresentam as notas finais de 32 alunos para as variancias 
GPA, TUCE e PSI. Os resultados da regressao logit estao na Tabela 15.8. Vejamos, agora, os resulta- 
dos probit para os mesmos dados. Observe que, como no caso do modelo logit para dados nao agrupados, 
teremos de recorrer a um procedimento de estimapao nao linear embasado no metodo da maxima 
verossimilhan 5 a. Os resultados dessa regressao calculada pelo EViews 6 estao na Tabela 15.13. 

“Qualitativamente”, os resultados do modelo probit sao comparaveis aos obtidos do modelo logit 
no que se refere a significancia estatistica individual dos coeficientes das variaveis GPA e PSI. Cole- 
tivamente, todos os coeficientes sao estatisticamente significativos, ja que o valor de estatistica da 
razao de verossimilhan 5 a e de 15,5458, com um valor p de 0,0014. Por motivos examinados nas 
proximas se?oes, nao podemos comparar os coeficientes de regressao logit e probit. 

Para fins de comparapao, apresentamos os resultados com base no modelo de probabilidade linear 
(MPL) para os conceitos da Tabela 15.14. Novamente, em termos qualitativos, os resultados MPL sao 
semelhantes aos modelos logit e probit no sentido de que o GPA e o PSI sao estatisticamente signifi¬ 
cativos mas o TUCE nao. Alem disso, as variaveis explanatorias juntas tem um impacto significativo 
no conceito, pois o valor F de 6,6456 e estatisticamente significativo, porque seu p-valor e de apenas 
0,0015. 


TABELA 15.13 


Dependent Variable: grade 
Method: ML—Binary probit 
Convergence achieved after 5 

iterations 



Variable 

Coefficient Std 

. Error Z- 

-Statistic 

Probability 

C 

-7.4523 

2.5424 

-2.9311 

0.0033 

GPA 

1.6258 

0.6938 

2.3430 

0.0191 

TUCE 

0.0517 

0.0838 

0.6166 

0.5374 

PSI 

1.4263 

0.5950 

2.3970 

0.0165 


LR statistic (3 df 1 

i =15.5458 

McFadden 

R 2 = 0.3774 


Probability (LR stat) =0.0014 


TABELA 15.14 


Dependent Variable: grade 


Variable 

Coefficient 

Std. Error t- 

-Statistic 

Probability 

C 

-1.4980 

0.5238 

-2.8594 

0.0079 

GPA 

0.4638 

0.1619 

2.8640 

0.0078 

TUCE 

0.0104 

0.0194 

0.5386 

0.5943 

PSI 

0.3785 

0.1391 

2.7200 

0.0110 

R 2 = 0 . 

4159 Durbin- 

-Watson d= 2.3464 

F- statistic = 6.6456 


O efeito marginal de uma varia^ao unitaria no valor de um regressor 
nos varios modelos de regressao 

No modelo de regressao linear, o coeficiente angular mede a variapao do valor medio do regres- 
sando para uma varia£ao unitaria no valor de um regressor, mantidas constantes as demais variaveis. 
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No modelo de probabilidade linear, o coeficiente angular mede diretamente a variapao na proba- 
bilidade de um evento ocorrer como o resultado de uma variapao unitaria no valor de um regressor, 
com o efeito de todas as outras variaveis mantidas constantes. 

No modelo logit o coeficiente angular de uma variavel da a variapao no logaritmo das chances 
associadas a uma variapao unitaria naquela variavel, novamente mantendo as demais variaveis cons¬ 
tantes. Mas, como observado, para o modelo logit a taxa de variapao na probabilidade de um evento 
acontecer e dada por fyPji 1 — P,), em que fy e o coeficiente (regressao parcial) do /-esimo regressor. 
Mas, ao avaliarP,, todas as variaveis inclufdas na analise sao envolvidas. 

No modelo probit, como vimos anteriormente, a taxa de variapao na probabilidade e compli- 
cada e e dada por /^/(Z,), em que/(Z ; ) e a funpao de densidade da variavel normal padrao e 
Z; = ySi + foXa + ■•• + faX* isto e, o modelo de regressao usado na analise. 

Tanto no modelo logit quanto no modelo probit todos os regressores estao envolvidos no calculo 
das variapoes na probabilidade, enquanto no MPL apenas o /-esimo regressor esta envolvido. Essa 
diferenpa pode ser uma razao para a preferencia do modelo MPL. Programas de estatrstica, como o 
STATA, calculam a taxa de variapao da probabilidade para os modelos logit e probit com mais faci- 
lidade. Nao ha mais necessidade de escolher o MPL so pela simplicidade dos calculos. 

15.10 Modelos logit e probit 


Embora no caso do exemplo das notas finais os modelos de probabilidade linear, logit e probit 
oferecessem, do ponto de vista qualitative, resultados semelhantes, restringiremos nossa atenpao aos 
modelos logit e probit devido aos problemas do modelo de probabilidade linear ja mencionados. 
Entre logit e probit, qual o preferivel? Na maioria das aplicapoes, os modelos sao bastante parecidos; 
a principal diferenpa esta na distribuipao logrstica que tem caudas ligeiramente mais pesadas, como 
podemos ver na Figura 15.6. Ou seja, a probabilidade condicional P i aproxima-se de 0 ou 1 com um 
ritmo mais lento no logit que no probit. Podemos ver isso mais claramente na Tabela 15.15. Nao ha 
razoes convincentes para preferir um dos modelos ao outro. Na pratica, muitos pesquisadores esco- 
lhem o modelo logit por sua relativa simplicidade matematica. 

Embora os modelos sejam semelhantes, deve-se ficar atento ao interpretar os coeficientes estima- 
dos pelos dois modelos. Por exemplo, para nosso exemplo de conceitos na escola, o coeficiente de 
GPAde 1,6258 do modelo probit (vejaaTabela 15.13) e 2,8261 do modelo logit (vejaaTabela 15,8) 
nao sao diretamente comparaveis. Isso porque, embora a distribuipao logrstica padrao (a base do logit) 
e a normal padrao (a base do probit) tenham ambas media zero, suas variancias sao diferentes; 1 para a 
normal padrao (como ja sabemos) e tt 2 /3 para a logrstica, em que jr & 22/7. Portanto, se multi- 
plicarmos o coeficiente probit por 1,81 (que e aproximadamente = tc/ \/3), obteremos aproximada- 
mente o coeficiente logit. Para nosso exemplo, o coeficiente probit de GPA e 1,6258. Multiplicando 
isso por 1,81, obtemos 2,94, que esta proximo do coeficiente logit. Por outro lado, se multiplicarmos 
o coeficiente logit por 0,55 ( = 1 /1,81), obteremos o coeficiente probit. 


FIGURA 15.6 

Distribuipoes 
acumuladas logit e 
probit. 


P 



0 
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TABELA 15.15 

Valores das funpoes 
de probabilidade 
acumulada 


EXEMPLO 15.7 

Fumar ou nao 
fumar 


Amemiya sugere, no entanto, a multiplicapao de uma estimativa logit por 0,625 para ter uma es- 
timativa melhor da estimativa probit correspondente. 34 Por outro lado, multiplicando um coeficiente 
probit por 1,6 ( = 1 /0,625), temos o coeficiente logit correspondente. A proposito, Amemiya tambem 
mostrou que os coeficiente de MPL sao relacionados, como se segue: 


/Smpl = 0,25A og it exceto para o intercepto 


e 


/Smpl = 0.25^i og it + 0,5 para o intercepto 


Deixamos para o leitor verificar se essas aproximapoes sao validas para o exemplo da pontuapao final 
de curso. 

Para concluirmos nossa discussao sobre o MPL e os modelos logit e probit, vamos considerar um 
exemplo extenso. 



Normal acumulada 

Logistica acumulada 

I 

1 C z 6~ s2 ^ds 

™=M- 

Pi{Z) - 1 _ z 

1 + e z 

-3,0 

0,0013 

0,0474 

-2,0 

0,0228 

0,1192 

-1,5 

0,0668 

0,1824 

-1,0 

0,1587 

0,2689 

-0,5 

0,3085 

0,3775 

0 

0,5000 

0,5000 

0,5 

0,6915 

0,6225 

1,0 

0,8413 

0,7311 

1,5 

0,9332 

0,81 76 

2,0 

0,9772 

0,8808 

3,0 

0,9987 

0,9526 


Para descobrirmos quais fatores determinam se uma pessoa sera ou nao fumante, 
obtivemos dados de 1.196 indivfduos. 35 Para cada individuo, ha informapoes sobre edu- 
capao, idade, renda e o prepo de cigarros em 1979. A variavel dependente e o fumante, 
sendo 1-fumantes e 0-nao fumantes. Mais analises serao realizadas no Exercfcio 15.20 e 
os dados podem ser encontrados na Tabela 15.28, no site deste livro. Para fins de compa- 
rapao, apresentamos os resultados com base nos modelos MPL, logit e probit em forma 
tabular (veja a Tabela 15.1 6). Esses resultados foram obtidos da versao 1 0 do STATA. 

( Continua ) 


34 AMEMIYA, T. "Qualitative response model: a survey." Journal of Economic Literature, 1981. v. 19, p. 481-536. 

35 Estes dados sao de Murray, Michael P. Econometrics : a modem introduction. Boston: Pearson/Addison-Wesley, 
2006 e estao disponfveis em: www.aw-bc.com/murray. 
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EXEMPLO 15.7 

(' Continuagao ) 

TABELA 15.16 


Variaveis 

Constante 

Idade 

Educagao 

Renda 

Pcigs79 

R 2 


MPL 

1,1230 

(5,96) 

-0,0047 

(-5,70) 

-0,0206 

(-4,47) 

1,03e-06 

(0,63) 

-0,0051 

(-1,80) 

0,0388 


Logit 

2,7450 

( 3 , 31 ) 

-0,0208 

(-5,58) 

-0,0909 

(-4,40) 

4,72e-06 

( 0 , 66 ) 

-0,0223 

(-1,79) 

0,0297 


Probit 

1,7019 

(3,33) 

-0,0129 

(-5,66) 

-0,0562 

(-4,45) 

2,72e-06 

(0,62) 

-0,0137 

(-1,79) 

0,0301 


Notas: Os dados entre parenteses sao razoes t para o MPL e razoes Z para o logit e probit. Para o logit 
e o probit, os valores de R 2 sao pseudorazoes R 2 . 


Embora os coeficientes dos tres modelos nao sejam diretamente comparaveis, qualitati- 
vamente sao semelhantes. Assim, idade, educagao e prego dos cigarros tem impacto nega- 
tivo em fumar e a renda tem impacto positivo. Estatisticamente, o efeito renda e zero e o 
efeito prego e significativo ao nfvel aproximado de 8%. No Exercfcio 15.20, pede-se que 
seja aplicado o fator de conversao para se obter varios coeficientes comparaveis. 

Na Tabela 15.1 7 apresentamos o efeito marginal de cada variavel sobre a probabilidade 
de fumar para cada tipo de modelo. 


TABELA 15.17 


Variaveis 

MPL 

Logit 

Probit 

Idade 

-0,0047 

-0,0048 

-0,0049 

Educagao 

- 0,0206 

-0,0213 

-0,0213 

Renda 

1,03e-06 

1,11 e-06 

1,03e-06 

Pcigs79 

-0,0051 

-0,0052 

-0,0052 


Nota: exceto a renda, os coeficientes estimados apresentam alta significance estatistica para idade e 
escolaridade, e apresentam significance ao nivel aproximado de 8% para o pre^o de cigarros. 


Como reconheceremos, o efeito marginal de uma variavel sobre a probabilidade de fumar 
para o MPL e obtido dos coeficientes de regressao estimados, mas para os modelos logit e 
probit eles precisam ser calculados como apresentado no capftulo. 

E interessante que os efeitos marginais sejam bastante parecidos para os tres modelos. Por 
exemplo, se o nfvel de escolaridade aumenta, em media, a probabilidade de alguem se tornar 
um fumante diminui em cerca de 2%. 


15.11 O modelo tobit 

Uma extensao do modelo probit e o tobit originalmente desenvolvido por James Tobin, Premio 
Nobel de economia. Para explicarmos esse modelo, continuaremos com o exemplo da casa propria. 
No modelo probit nossa preocupagao era estimar a probabilidade de ter casa propria como fun can de 
algumas variaveis socioeconomicas. No modelo tobit nosso interesse e verificar o montante em 
dinheiro que uma pessoa ou familia gasta em uma casa em relagao a variaveis socioeconomicas. 
Agora enfrentamos um dilema: se um consumidor nao compra uma casa, obviamente nao temos 
dados sobre despesas com habitagao para esses consumidores; temos dados apenas para os consu- 
midores que realmente compram uma casa. 

Os consumidores sao divididos em dois grupos, um consistindo em, por exemplo, n.\ consumido¬ 
res sobre os quais temos informagao a respeito dos regressores (por exemplo, renda, taxa de juros de 
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hipotecas, numero de pessoas na famflia etc.), bem como do regressando (montante de despesas com 
habitagao) e outro consistindo em n 2 consumidores sobre quem temos informagao apenas dos regres- 
sores, mas nao do regressando. Uma amostra em que as informagoes do regressando sao disponfveis 
apenas para algumas observagoes e conhecida como amostra censurada. 36 

Portanto, o modelo tobit e conhecido tambem como um modelo de regressao censurado. Alguns 
autores chamam esses modelos de modelos de regressao com variavel dependente limitada devido 
a restrigao imposta aos valores assumidos pelos regressando. 

Estatisticamente, podemos expressar o modelo tobit como: 

Yi = + PiXi + Ui se LD > 0 (15 111 ) 

= 0 caso contrario 


em que LD = lado direito. Nota: variaveis adicionais X podem ser incluidas facilmente ao modelo. 

Podemos calcular a regressao (15.11.1) usando apenas ri\ observagoes e nao nos preocupando com 
as n 2 observagoes remanescentes? A resposta e nao, pois as estimativas MQO dos parametros obtidas 
do subconjunto de n, observagoes serao tendenciosas e inconsistentes\ sao tendenciosas mesmo as- 
sintoticamente. 37 


Para tanto, considere a Figura 15.7. Se Y nao for observado (em virtude da censura), todas essas 
observagoes (= n 2 ), denotadas por cruzes, ficarao no eixo horizontal. Se Yfor observado , as observa¬ 
goes (= n |). denotadas por pontos, ficarao no piano X—Y. Toma-se claro, intuitivamente, que, se estimar- 
mos uma linha de regressao com base apenas em n ] observagoes, o intercepto e os coeficientes angulares 
resultantes tenderao a ser diferentes do que se todas as (n j + n 2 ) forem levadas em consideragao. 


Como podemos estimar os modelos tobit, ou de regressao censurada, como a Equagao (15.11.1)? 
O mecanismo real envolve o metodo de maxima verossimilhanga, que e bastante complexo e esta 
alem do escopo deste livro, mas o leitor podera obter mais informagoes sobre o metodo consultando 
as referencias. 38 


FIGURA 15.7 

Diagrama de 
dispersao do montante 
gasto na compra de 
casa propria versus 
renda. 


x: dados de despesas nao 
Y disponfveis, mas dados 

de renda disponfveis 
•: dados disponfveis de 
despesa e renda 



Renda 


X 


36 Uma amostra censurada deve ser distinguida de uma amostra truncada, em que as informagoes dos regres- 
sores estao disponfveis apenas se o regressando for observado. Nao trataremos desse assunto aqui, mas o leitor 
interessado pode consultar GREENE, William H. Econometric analysis. 4. ed. Englewood Cliffs, NJ.: Prentice Hall, 
cap. 19. Para uma discussao menos complexa, veja KENNEDY, Peter. A guide to econometrics. 4. ed. Cambridge, 
Mass.: The MIT Press, 1998, cap. 16. 

37 O vies surge do fato de que, se consideramos apenas as n, observagoes e omitimos as outras, nao ha garantia 
de que £ (u ,) sera necessariamente zero. E sem £ (u,) = 0 nao podemos garantir que as estimativas do MQO 
serao nao tendenciosas. Esse vies e abordado no Apendice 3A, Equagoes (4) e (5). 

38 Veja GREENE, op. cit. Uma discussao um pouco menos tecnica pode ser encontrada em BREEN, Richard. Regression 
models: censored, sample selected or truncated data. Newbury Park, California: Sage Publications,! 996. 
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James Heckman propos um metodo alternative ao da maxima verossimilhanga (MV), que e com- 
parativamente simples. 39 Consiste em um procedimento de estimagao em duas etapas. Na primeira, 
calculamos a probabilidade de um consumidor ter casa propria, o que e feito com base no modelo 
probit. Na segunda, calculamos o modelo (15.11.1) acrescentando uma variavel (chamada razao in- 
versa de Mills ou taxa de risco) que e derivada da estimativa probit. Para o mecanismo real, veja o 
artigo de Heckman. O procedimento de Heckman resulta em estimativas consistentes dos parametros 
da Equagao (15.11.1), mas nao sao tao eficientes quanto as estimativas de MV. Uma vez que os progra- 
mas de estatfstica mais modemos seguem a rotina da MV, pode ser preferivel usa-los em vez do proce¬ 
dimento Heckman de duas etapas. 

Ilustra^ao do modelo tobit: o modelo de Ray Fair de casos 
extraconjugais 40 

Em um artigo interessante e inovador do ponto de vista teorico, Ray Fair coletou uma amostra de 
601 homens e mulheres casados pela primeira vez e analisou suas respostas a uma pergunta sobre 
casos extraconjugais. 41 As variaveis usadas neste estudo sao definidas como se segue: 

Y = numero de casos no ano anterior, 0, 1, 2, 3, 4-10 (codificados como 7) 

Z\= 0 para mulheres e 1 para homens 
Z 2 = idade 

Z 3 = numero de anos casado 

Z 4 = filhos: 0 se nao tiver filhos e 1 se tiver 

Z 5 = religiosidade em uma escala de 1 a 5, 1 sendo ateu 

Z 6 = escolaridade: primario = 9; segundo grau =12; doutorado ou outro = 20 

Z 7 = ocupagao, segundo a escala “Hollingshead”, 1-7 

Z 8 = autoavaliagao no casamento, 1 = muito infeliz, 5 = muito feliz 


TABELA 15.18 

Estimativas de MQO 
e tobit de casos 
extraconjugais 


Variavel Explanatory 

Estimativa MQO* 

Estimativa tobit 4 

Intercepto 

5,8720 (5,1622) 

7,6084 (1,9479) 

Zi 

0,0540 (0,1799) 

0,9457 (0,8898) 

z 2 

-0,0509 (-2,2536) 

-0,1926 (-2,3799) 

z 3 

0,1694 (4,1109) 

0,5331 (3,6368) 

z 4 

-0,1426 (- 0,4072) 

1,0191 (0,7965) 

z 5 

-0,4776 (- 4,2747) 

-1,6990 (-4,1906) 

z 6 

-0,0137 (- 0,2143) 

0,0253 (0,1113) 

Zv 

0,1049 (1,1803) 

0,2129 (0,6631) 

Zs 

-0,7118 (-5,9319) 

-2,2732 (-5,4724) 

R 2 

0,1317 

0,1515 


* Valores entre parenteses sao os valores t. 
t Valores entre parenteses sao os valores Z (normal padrao). 

Nota: no total, ha 601 observances, das quais 451 tem valores zero para a variavel dependente (numero de casos extraconjugais) 
e 150 tem valores nao iguais a zero.. 


Das 601 respostas, 451 individuos nao tiveram casos extraconjugais, e 150 individuos tiveram um 
ou mais casos. Nos termos da Figura 15.7, se tragarmos o grafico do numero de casos no eixo vertical 
e, por exemplo, escolaridade no eixo horizontal, havera 451 observagoes ao longo do eixo horizontal. 
Temos uma amostra censurada, e um modelo tobit pode ser adequado. 


39 HECKMAN, J. J. "Sample selection bias as a specification error." Econometrica, v. 47, p. 153-161. 

40 FAIR, Ray. "A theory of extramarital affairs." journal of Political Economy, v. 86, 1978, p. 45-61. Leia http://fair- 
model.econ.yale.edu/rayfair/pdf/1978DAT.ZIP sobre os dados. 

41 Em 1969 Psychology Today publicou um questionario com 101 perguntas sobre genera e pediu aos leitores para 
enviarem suas respostas. Na edigao de julho de 1970, os resultados da pesquisa foram discutidos com base em 2 
mil respostas coletadas na forma eletronica. Ray Fair extraiu a amostra de 601 dessas respostas. 
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A Tabela 15.18 da estimativas do modelo anterior usando tanto os procedimentos MQO (inade- 
quado) quanto os de maxima verossimilhan^a (adequado). Como podemos ver, o MQO inclui 451 
individuos que nao tiveram casos extraconjugais e 150 que tiveram um ou mais casos. O metodo da 
MV leva isso em conta explicitamente, mas o metodo MQO nao leva; dai a diferenpa entre as duas 
estimativas. Por razoes ja discutidas, deve-se contar com a MV e nao com os MQO. Os coeficientes 
nos dois modelos podem ser interpretados como qualquer outro coeficiente de regressao. O coeficien- 
te negativo de Z g (felicidade conjugal) significa que, quanto maior a felicidade conjugal, menor a in- 
cidencia de casos extraconjugais, talvez um achado nao surpreendente. 

Veja que, se estivermos interessados na probabilidade de casos extraconjugais e nao no numero de tais 
casos, podemos usar o modelo probit atribuindo Y = 0 para aqueles que nao tiveram casos extraconjugais 
e Y = 1 para aqueles que tiveram tais casos, dando os resultados da Tabela 15.19. Com o conhecimento 
da modelagem probit, os leitores sao capazes de interpretar os resultados probit dessa tabela. 


15.12 Modelagem de dados contaveis: o modelo de regressao 
de Poisson 


Ha muitos fenomenos cujo regressando e do tipo contavel, como o numero anual de viagens fei- 
tas por uma famflia, o numero de patentes registradas anualmente por uma empresa, o numero de 
visitas anuais ao dentista ou ao medico, o numero de idas semanais ao armazem, o numero de multas 
recebidas ao ano por estacionamento em local proibido ou por excesso de velocidade, o numero de 
dias passados no hospital em certo perfodo, o numero de carros que passam pela cabine de pedagio em 
um intervalo de cinco minutos e assim por diante. Em cada um desses casos, a variavel subjacente e 
discreta, assumindo apenas um numero finito de valores. As vezes os dados contaveis tambem se refe- 
rem a ocorrencias rams , ou infrequentes, como ser atingido por um raio mais de uma vez na mesma 
semana, ganhar na loteria mais de uma vez em um espa£o de duas semanas ou ter mais de um enfarte 
em um mes. Como modelamos esses fenomenos? 


TABELA 15.19 


Dependent Variable: YSTAR 





Method: ML—Binary 
Sample: 1-601 

probit 





Included observations: 601 
Convergence achieved after 5 

iterations 




Variable 

Coefficient 

Std. Error 


7, Statistic 

Probability 

C 

0.779402 

0.512549 


1.520638 

0.1284 

Zi 

0.173457 

0.137991 


1.257015 

0.2087 

z 2 

-0.024584 

0.010418 


-2.359844 

0.0183 

z 2 

0.054343 

0.018809 


2.889278 

0.0039 

z 4 

0.216644 

0.165168 


1.311657 

0.1896 

Zs 

-0.185468 

0.051626 


-3.592551 

0.0003 

Z 6 

0.011262 

0.029517 


0.381556 

0.7028 

Zn 

0.013669 

0.041404 


0.330129 

0.7413 

Zs 

-0.271791 

0.053475 


-5.082608 

0.0000 

Mean dependent 

var. 

0.249584 

S.D. 

dependent var. 

0.433133 

S.E. of regression 

0.410279 

Akaike info criterion 

1.045584 

Sum squared resid. 

99.65088 

Schwarz criterion 

1.111453 

Log likelihood 


-305.1980 

Hannan-Quinn criter. 

1.071224 

Restr. log likelihood 

■337.6885 

Avg. 

log likelihood 

-0.507817 

LR statistic (8 

df) 

64.98107 

McFadden R-squared 

0.096215 

Probability (LR 

. stat) 

4.87E-11 




Obs. with Dep = 

0 

451 

Total 

obs. 

601 

Obs. with Dep = 

1 

150 
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Assim como a distribui^ao de Bernoulli foi escolhida para o modelo de decisao sim/nao no mode- 
lo de probabilidade linear, a distribuifao probabilistica, adequada especificamente para dados conta- 
veis, e a de Poisson. A distribuifao de Poisson e dada por: 42 

f(Yi) = 11 ^ ^ Y= 0,1,2,... (15.12.1) 

em que/(K) denota a probabilidade de que a variavel Y assuma valores inteiros nao negativos e Y\ (leia-se 
fatorial de Y) e representado por 7! = 7 x (7 — 1) x (7 — 2) x ... x 2 x 1. Pode ser demonstrado que 

E(Y) = ii (15.12.2) 

var(7) = p, (15.12.5) 

Note um aspecto interessante da distribuigao de Poisson: sua variancia e a mesma que o valor medio. 
O modelo de regressao de Poisson pode ser escrito como: 

Y, = E(Yi) + u, = p, + u, (15.12.4) 

em que os Y sao distribmdos independentemente como variaveis aleatorias de Poisson com media /./, 
para cada individuo expresso como 

di = E{Yt) = Pi + P 2 X 2 i + H—+ p k x u (15.12.5) 

em que os X sao algumas da variaveis que poderiam afetar o valor medio. Por exemplo, se nossa 
variavel discreta for o numero de visitas do Metropolitan Museum of Art em Nova York em determi- 
nado ano, esse numero dependent de variaveis como renda do consumidor, pre 50 da entrada, distancia 
do museu e taxas de estacionamento. 

Para fins de estima 9 ao, escrevemos o modelo como: 

ii ^p— t 1 

Y, = + u, (15.12.6) 

sendo ,u substituido pela Equa 9 ao (5.12.5). Como podemos ver, o modelo de regressao resultante tera 
parametros nao lineares, necessitando da estima 9 ao de uma regressao nao linear discutida no capftulo 
anterior. Vamos considerar um exemplo concreto para entender como tudo isso funciona. 


EXEMPLO 15.8 

Estudo geriatrico 
da frequencia de 
quedas 


Os dados usados aqui foram coletados por Neter et al 43 e relacionam-se a 100 individuos 
com 65 anos ou mais. O objetivo do estudo foi registrar o numero de quedas (= V) sofridas 
por esses individuos em relafao ao genera (X 2 = 1 mulher e 0 para homens), um indice de 
equilibrio (X 3 ) e um indice de forfa (X 4 ). Quanto mais alto for o indice de equilibrio, mais 
estavel sera o sujeito, e quanto mais alto o indice de forfa, mais forte sera o sujeito. Para des- 
cobrir se a educagao ou a educafao mais exercicios aerobicos tern efeito no numero de que¬ 
das, os autores introduziram uma variavel adicional (Xi), chamada de variavel de intervengao, 
tal que = 0 se apenas educafao e = 1 se educafao mais treinamento em exercicio aero- 
bico. Os sujeitos foram distribuidos aleatoriamente entre os dois metodos de intervenfao. 

Usando o EViews, obtivemos o resultado da Tabela 15.20. 

( Continua ) 


42 Consulte qualquer livro padrao sobre estatistica para detalhes dessa distribuigao. 

43 NETER, John; KUTNER, Michael H.; NACHTSHEIM, Christopher WASSERMAN, William. Applied regression 
models. 3. ed. Chicago: Irwin, 1996. Os dados foram obtidos do disco de dados incluido no livro e referem-se 
ao Exercicio 14.28. 
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EXEMPLO 15.8 

( Continuagao ) 

TABELA 15.20 


Dependent Variable: Y 
Sample: 1-100 

Convergence achieved after 7 iterations 
7= EXP(C(0)+C(1)* XI + C(2) *X2 + C( 3)*X3+C(4)*X4) 



Coefficient 

Std. Error 

t-Statistic 

Probability 

C( 0) 

0.37020 

0.3459 

1.0701 

0.2873 

C(l) 

-1.10036 

0.1705 

-6.4525 

0.0000 

C( 2) 

-0.02194 

0.1105 

-0.1985 

0.8430 

C(3) 

0.01066 

0.0027 

3.9483 

0.0001 

C(4) 

0.00927 

0.00414 

2.2380 

0.0275 


R 2 = 0.4857 Adjusted R 2 = 0.4640 
Log likelihood=-197.2096 Durbin-Watson statistic = 1.7358 


Nota: EXP{ ) significa e (a base do logaritmo natural) elevado a potencia indicada em ( ). 

Interpretacao dos resultados. Lembre-se de que o que obtivemos na Tabela 15.20 e o 
valor medio estimado para o i-esimo indivfduo, isto e, o que estimamos e:. 


_ „0,3702-1.100366X 1 ,-0,02194X2, + 0.0106X 3/ +0.00927X4, 


(15.12.7) 


Para descobrirmos o valor efetivo medio para a /-esima pessoa, precisamos introduzir os va- 
lores das diversas variaveis X correspondentes aquela pessoa. Por exemplo, o indivfduo 99 
tinha os seguintes valores: Y = 4, X-\ = 0, X 2 = 1, X 3 = 50 e X 4 = 56. Colocando esses valores 
na Equagao (15.12.7), obtemos 3,3538 como o valor medio estimado para o 99° indivfduo. 
O valor efetivo de Y para esse indivfduo foi 4. 

Agora, se queremos determinar a probabilidade de um indivfduo similar ao de numero 99 
ter menos de 5 quedas por ano, podemos ter esse resultado como se segue: 


P(Y < 5) = P(Y = 0) + P(Y = 1) + P(Y = 2) + P(Y = 3) + P(Y = 4) 

_ (3,3538)°e -3 ’ 3538 (3.3538) 1 e“ 33538 (3,3538) 2 e“ 33538 

" 0 ! + 1 ! + 2 ! 

(3,3538) 3 e- 33538 (3,3538) 4 e- 33538 

+ 3! + 4! 

= 0,7491 

Tambem podemos descobrir o efeito marginal, ou parcial, de um regressor sobre o valor 
medio de Y do seguinte modo. Em termos de nosso exemplo ilustrativo, suponha que dese- 
jamos conhecer o efeito de um a-umento unitario no fndice de forga (X 4 ) sobre o Y medio. 
Uma vez que 


= e c ° + Ci Xi/+ C 2 X 2 /+ C 3 X 3 /+ C 4 X 4 , 


(15.12.8) 


queremos encontrar 3/x/9X 4 . Usando a regra da cadeia do calculo, podemos demonstrar fa- 
cilmente que este e igual a 


— = c 4 e Co+ c i x i'+ c 2 x 2i+ c 3 ^b/+ c 4 Xai - c 4 n (15.12.9) 

9X 4 


( Continua ) 
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Isto e, a taxa de varia^ao do valor medio com relagao a um regressor e igual ao coeficiente desse 
regressor multiplicado pelo valor medio. Naturalmente, o valor medio fi dependera dos valores 
assumidos por todos os regressores no modelo. Isso e parecido com os modelos logit e probit 
que discutimos anteriormente, em que a contribuigao marginal de uma variavel tambem 
dependia dos valores assumidos por todas as variaveis no modelo. 

Retornando a significance estatfstica dos coeficientes individuals, vemos que o intercepto e a 
variavel X 2 sao estatisticamente insignificantes tornados individualmente. Mas note que os erros 
padrao da tabela sao assintoticos e, por isso, os valores f devem ser interpretados assintoticamen- 
te. Como visto anteriormente, em geral os resultados de todos os procedimentos de estima^ao 
iterativa, nao linear, sao validos apenas para amostras grandes. 

Para concluirmos nossa discussao do modelo de regressao de Poisson, podemos notar 
que o modelo impoe pressupostos restritivos, visto que a media e a variancia do modelo de 
Poisson sao constantes e que a probabilidade de uma ocorrencia e constante em qualquer 
ponto do tempo. 


15.13 Outros topicos sobre modelos de escolha qualitativa 

Como observado no infcio, os modelos de escolha qualitativa sao um assunto muito vasto. O que 
apresentamos neste capftulo sao alguns dos modelos basicos. Para aqueles que desejarem saber mais 
sobre o assunto, apresentaremos brevemente alguns outros modelos. Nao nos deteremos neles, pois 
isso nos levaria para muito alem do escopo deste livro. 

Modelos logit e probit ordinais 

Nos modelos logit e probit bivariados estavamos interessados em modelar uma variavel de res- 
posta do tipo sim ou nao. Mas muitas vezes a variavel resposta ou regressando pode ter mais de dois 
resultados e estes sao de natureza ordinal; ou seja, nao podem ser expressos em uma escala de in- 
tervalo. Com frequencia em uma pesquisa do tipo questionario as respostas sao postas em termos de 
uma escala Likert, como “concordo totalmente”, “concordo parcialmente” ou “discordo totalmente”. 
Ou as respostas a uma pesquisa sobre instnKjao sao “segundo grau incompleto”, “segundo grau comple- 
to”, “curso superior” ou “curso profissionalizante”. Muitas vezes essas respostas sao codificadas como 0 
(segunto grau incompleto), 1 (segundo grau completo), 2 (curso superior) ou 3 (pos-gradua 9 ao). 
Tratam-se de escalas ordinais, porque esta clara a hierarquia entre as categorias, mas nao podemos 
dizer que 2 (curso superior) equivale a duas vezes 1 (segundo grau completo) ou que 3 (pos-grauda- 
5 ao) seja 3 vezes 1 (segundo grau completo). 

Para estudar fenomenos como esses, e preciso estender os modelos logit e probit bivariados para 
levar em conta as varias categorias hierarquicas. A aritmetica torna-se muito complexa, pois temos de 
recorrer a distributes de probabilidade normais e logfsticas em multiplos estagios para levar em 
conta as varias categorias hierarquizadas. O leitor interessado na matematica subjacente e em algu- 
mas das aplica 9 oes pode consultar os textos de Greene e Maddala ja mencionados. Em um nivel mais 
superficial, o leitor pode recorrer ao artigo de Liao. 44 Pacotes estatfsticos como LIMDEP, EViews, 
STATA e SHAZAM incluem rotinas para estimar modelos logit e probit ordenados. 

Modelos logit e probit multinomiais 

Nos modelos probit e logit ordenados a variavel de resposta tem mais de duas categorias ordenadas 
ou classificadas, mas ha situates em que o regressando nao e ordenado. Veja, por exemplo, a escolha 
de meio de transporte para ir ao trabalho. As opcoes podem ser bicicleta, motocicleta, automovel, 
onibus ou trem. Embora essas sejam respostas categoricas, nao ha classificaqiao ou ordem; sao de 
carater essencialmente nominal. Para outro exemplo, considere as classifica 9 oes ocupacionais, como 
nao qualificado, semiqualificado e altamente qualificado. Novamente, nao ha ordenamento. De modo 


44 


LIAO, Tim Futing, op. cit. 
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semelhante, as opgoes ocupacionais como autonomo, contratado em empresa, trabalhar para o go- 
verno local e para o governo federal tem um carater essencialmente nominal. 

As tecnicas dos modelos logit e probit multinomiais podem ser empregadas para estudar essas ca- 
tegorias nominais. Novamente, a matematica e um tan to complicada. As references citadas anterior- 
mente darao os fundamentos dessas tecnicas e programas de estatfstica citados anteriormente podem 
ser usados para implementar esses modelos, se o uso deles for necessario em casos especificos. 

Modelos de dura^ao 

Considere perguntas como estas: (1) o que determina a duragao dos periodos de desemprego? (2) 
O que determina a vida util de uma lampada? (3) Quais os fatores que determinant a duragao de uma 
greve? (4) O que determina o tempo de sobrevivencia de um paciente soropositivo? 

Essas sao indagagoes relacionadas aos modelos de duragao, conhecidos como analise de sobre¬ 
vivencia ou analise time-to-event. Em cada um dos exemplos citados, a variavel-chave e a extensao 
ou o perfodo de tempo, modelado como variavel aleatoria. Novamente, a matematica envolve as 
fungoes de distribuigao acumulada (FDA) e as fungoes de distribuigao de probabilidade (FDP) das 
distribuigoes de probabilidade adequadas. Embora os detalhes tecnicos possam ser tediosos, ha li- 
vros acessrveis sobre o assunto. 45 

Programas estatisticos como STATA e LIMDEP podem estimar prontamente tais modelos de 
duragao. Eles tem exemplos para ajudar o pesquisador no uso de tais modelos. 


Resuino e 
conclusoes 


1. Os modelos de escolha qualitativa referem-se aos modelos em que a variavel resposta, ou 
regressando, nao e quantitativa ou uma escala de intervalo. 

2. O modelo de escolha qualitativa mais simples e o modelo de probabilidade linear, em que o 
regressando e do tipo sim/nao ou presente/ausente. 

3. O modelo de regressao binaria mais simples possfvel e o de probabilidade linear, em que a regres¬ 
sao de escolha qualitativa e feita contra as variaveis explanatorias por meio do metodo de padrao 
MQO. Nesse caso, a simplicidade pode nao ser uma virtude, pois o modelo de probabilidade li¬ 
near sofre de varios problemas de estimagao. Mesmo que alguns dos problemas de estimagao 
possam ser superados, a debilidade fundamental desse modelo e que ele pressupoe que a proba¬ 
bilidade de ocorrencia de alguma coisa aumente linearmente com o nivel do regressor. Essa e 
uma hipotese muito restritiva, que pode ser evitada se empregarmos os modelos logit e probit. 

4. No modelo logit, a variavel dependente e o logaritmo da razao de chances, que e uma fungao li¬ 
near dos regressores. A fungao de probabilidade subjacente ao modelo logit e a distribuigao logis- 
tica. Se os dados disponiveis forem agrupados, podemos recorrer aos MQO para calcular os 
parametros do modelo logit, desde que levemos em conta explicitamente a natureza hetero- 
cedastica do termo de erro. Se os dados forem disponiveis no nivel individual ou micro, e 
necessario seguir os procedimentos de estimagao nao lineares nos parametros. 

5. Se escolhermos a distribuigao normal como a distribuigao de probabilidade adequada, podemos 
usar o modelo probit. Esse e um pouco diffcil, em termos de calculo matematico, pois envolve 
integrals. Mas para todos os fins, tanto o modelo logit quanto o probit dao resultados semelhantes. 
Na pratica, a opgao depende, portanto, da facilidade de calculo, o que nao e um problema serio 
com os programas de estatistica sofisticados que atualmente estao disponiveis. 

6. Se a variavel de escolha for do tipo contavel, o modelo usado com mais frequencia no trabalho 
aplicado e o da regressao de Poisson, que se baseia na distribuigao de probabilidade de Poisson. 

7. Um modelo que esta intimamente relacionado ao modelo probit e o tobit, tambem conhecido 
como modelo de regressao censurada. Neste, a variavel de escolha e observada apenas se 
forem atendidas certas condigoes. Assim, a questao de quanto se gasta em um carro so sera 


45 Veja, por exemplo, HOSMER, Jr., DAVID W.; LEMESHOW, Stanley. Applied survival analysis. Nova York: John 
Wiley & Sons, 1999. 
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significativa diante da decisao de comprar um automovel. Entretanto, Maddala observa que 
o modelo tobit e “aplicavel somente onde a variavel latente [a variavel basica subjacente a 
um fenomeno] pode, em principio, assumir valores negativos e os valores zero observados 
sao consequencia da censura e da impossibilidade de cbservagao”. 46 

8. Ha varias extensoes dos modelos de regressao com escolha qualitativa. Estes incluem o logit e o 
probit ordenados e nominais. O raciocmio que fundamenta esses modelos e o mesmo que o dos 
modelos logit e probit mais simples, embora os calculos matematicos liquem bem complicados. 

9. Por fim, consideramos brevemente os chamados modelos de duragao, em que a duragao de 
um fenomeno, como desemprego ou doenga, depende de varios fatores. Em tais modelos, a 
duragao, ou o periodo, torna-se a variavel de interesse de pesquisa. 


15.1. Consulte os dados da Tabela 15.2. Se Y t for negativo, suponha que ele seja igual a 0,01 e, se for 
maior que 1, suponha que seja igual a 0,99. Calcule novamente os pesos vv ( - e estime o MPL usando 
os MQP. Compare os resultados obtidos com aqueles dados na Equagao (15.2.11) e comente-os. 

15.2. Para os dados relativos a casa propria apresentados na Tabela 15.1, as estimativas de maxima 
verossimilhanga do modelo logit sao: 

Li = In = - 493,54+ 32,96 renda 

t = (- 0,000008)(0,000008) 

Comente esses resultados, tendo em mente que todos os valores da renda acima de 16 (mil 
dolares) correspondem a Y = 1 e todos os valores de renda inferiores a 16 correspondem a 0. 
A priori, o que voce poderia esperar em tal situagao? 

15.3. Ao estudar a compra de bens duraveis Y ( Y = \ em caso de compra, Y = 0 se nao houver com- 
pra) como uma fungao de diversas variaveis para um total de 762 famflias, Janet A. Fisher 
obteve os seguintes resultados de MPL: 


Variavel explanatoria 

Coeficiente 

Erro padrao 

Constante 

0,1411 

— 

Renda disponivel, 1957, 

0,0251 

0,0118 

(Renda disponivel = Xi) 2 , X 2 

- 0,0004 

0,0004 

Conta corrente, X 3 

-0,0051 

0,0108 

Conta poupanga, X 4 

0,001 3 

0,0047 

Titulos do governo, X 5 

-0,0079 

0,0067 

Condigao de moradia: aluguel, X 6 

- 0,0469 

0,0937 

Condigao de moradia: casa propria, X 7 

0,0136 

0,0712 

Aluguel mensal, Xg 

-0,7540 

1,0983 

Pagamento mensal de hipoteca, X 9 

-0,9809 

0,5162 

Divida pessoal exceto prestagoes, Xi 0 

-0,0367 

0,0326 

Idade, Xn 

0,0046 

0,0084 

Idade ao quadrado, X 12 

- 0,0001 

0,0001 

Estado civil, X 13 (1 =casado) 

0,1760 

0,0501 

Numero de filhos, X 14 

0,0398 

0,0358 

(Numero de filhos = X 14 ) 2 , X 15 

-0,0036 

0,0072 

Pianos de compra, Xi 6 (1 = planejado; 

0,1760 

0,0384 


0 nao planejado) R 2 = 0,1 336 

Notas: todas as variaveis financeiras estao em milhares de dolares. 

Condigao de moradia: imovel alugado (1 se alugado; 0 em caso contrario). Condigao de moradia: casa propria 
(1 se tern casa; 0 caso contrario). 

Fonte: FISHER, Janet A. “An analysis of consumer goods expenditure.” The Review of Economics and Statistics, 
v. 64, n. 1, p. 67, tabela 1, 1962. 


46 MADDALA, G. S. Introduction to econometrics. 2. ed. Nova York: Macmillan, 1992. p. 342. 

* "An analysis of consumer goods expenditure." The Review of Economics and Statistics, 1962. v. 64, n. 1, p. 64-71. 
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a. Faya um comentario geral a respeito da equayao estimada. 

b. Como o coeficiente de -0,0051 associado a variavel da conta corrente poderia ser interpre- 
tado? Como se justificaria o sinal negativo desta variavel? 

c. Qual a razao para introduzirem as variaveis idade elevada ao quadrado e o numero de fi- 
lhos? Por que em ambos os casos o sinal e negativo? 

d. Supondo valores zero para todas as variaveis, exceto a renda, determine a probabilidade 
condicional de uma famflia cuja renda e de $ 20.000 para comprar um bem duravel. 

e. Estime a probabilidade condicional de ter bens duraveis, dado: X\ = $ 15.000, X 3 = $ 3.000, 
X 4 = $ 5.000, X 6 = 0, X 7 = 1, X 8 = $ 500, X 9 = $ 300, X 10 = 0, X n = 35, X 13 = 1, X l4 = 2, 
X 16 = 0. 

15.4. O valor de R 2 na regressao de participayao na forya de trabalho dada na Tabela 15.3 e 0,175, 
que e bem baixo. E possivel testar esse valor para significancia estatistica? Que teste podemos 
usar e por que? Comente de modo geral sobre o valor de R 2 nesses modelos. 

15.5. Calcule as probabilidades de ter casa propria em varios nfveis de renda da regressao (15.7.1). 
Represente-os graficamente contra a renda e comente a relayao resultante. 

*15.6 Na regressao probit dada na Tabela 15.11, mostre que o intercepto e igual a —fji x /a x e a incli- 
nayao e igual a 1 /a x , em que fi x e a x sao a media e o desvio padrao de X. 

15.7. Dos dados para 54 areas estatisticas metropolitanas padrao (SMSA), Demaris estimou o se- 
guinte modelo logit para explicar o alto indice de homicidios versus indices baixos: 1 

In 6, = 1,1387 + 0,0014/*,-+ 0,0561C,- 0,4050R, 
ep = (0,0009) (0,0227) (0,1568) 

em que O = a chance de alto fndice de homicfdio, P = populayao em milhares de habitantes de 
1980, C = taxa de crescimento populacional de 1970 a 1980, R = quociente de alfabetizayao e os 
ep sao os erros padrao assintoticos. 

a. Como poderiamos interpretar os diversos coeficientes? 

b. Quais dos coeficientes sao estatisticamente significativos, em termos individuals? 

c. Qual o efeito de um aumento de um ponto percentual no quociente de alfabetizayao sobre 
as chances de ter um fndice mais alto de homicidios? 

d. Qual o efeito de um aumento de um ponto percentual na taxa de crescimento populacional 
sobre as chances de uma taxa de homicidios mais alta? 

15.8. Compare e comente as regressoes MQO e MQP nas Equayoes (15.7.3) e (15.7.1). 

Exercfcios aplicados 

15.9. Da pesquisa de oryamentos familiares feita pelo Dutch Central Bureau of Statistics em 1980, 
J. S. Cramer obteve o seguinte modelo logit baseado em uma amostra de 2.820 familias. (Os 
resultados apresentados aqui se baseiam no metodo de maxima verossimilhanya e referem-se 
a terceira iterayao.){ O objetivo do modelo logit era determinar a posse de um carro como 
funyao (logaritmica) da renda. A posse de carro era uma variavel binaria: Y = 1 se uma famflia 
tivesse carro, zero se nao tivesse. 


‘Opcional. 

tDEMARIS, op. cit., p. 46. 

JCRAMER, J. S. An introduction to the logit model for economist. 2. ed., publicado e distribufdo por Timberlake 
Consultants Ltd., 2001, p. 33. Estes resultados sao reproduzidos do programa de estatistica PC-CIVE 10 publica¬ 
do por Timberlake Consultants, p. 51. 
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Li= -2,77231 + 0,347582 In Renda 
t= (-3,35) (4,05) 

X 2 (l gl)= 16,681 (valor p = 0,0000) 


em que L ; = logit estimado e In Renda e o logaritmo da renda. O x 2 mede a qualidade do ajusta- 


mento do modelo. 

a. Interprete o modelo logit estimado. 

b. Do modelo logit estimado, como voce obteria a expressao para a probabilidade de ter um 
carro? 

c. Qual a probabilidade de uma famflia com renda de $ 20 mil ter um carro? E com um nfvel 
de renda de $ 25 mil? Qual a taxa de variac^ao da probabilidade com o nivel de renda de $ 


20 mil? 


d. Comente a significancia estatistica do modelo logit estimado. 

15.10. Estabelega a Equanao (15.2.8). 

15.11. Em um estudo importante das taxas de graduac^ao de todos os alunos da faculdade e apenas 


dos matriculados negros, Bowen e Bok obtiveram os resultados apresentados na Tabela 15.21, 
baseados no modelo logit.* 

a. Qual a conclusao geral que podemos tirar sobre as notas de gradua§ao de todos os matricu¬ 
lados e dos negros matriculados? 

b. A razao de chances e a razao entre duas possibilidades. Compare dois grupos de todos os 
matriculados, um com um SAT maior que 1.299 e o outro com SAT inferior a 1.000 (a ca- 
tegoria-base). A razao de chances de 1.393 indica que as chances de os matriculados na 
primeira categoria sao 39 mais altas que aqueles na segunda. As varias razoes de chances 
mostradas na tabela estao de acordo com uma expectativa a priori ? 

c. O que podemos dizer sobre a significancia estatistica dos parametros estimados? O que 
dizer da significancia geral do modelo estimado? 

15.12. No modelo probit da Tabela 15.11, o termo de erro it,- tem esta variancia: 


em que/) e a funnao de densidade normal padrao avaliada em F 

a Dada a variancia de u h como voce transformaria o modelo na Tabela 15.10 para que o ter¬ 
mo de erro resultante fosse eliminado? 

b. Use os dados da Tabela 15.10 para mostrar os dados transformados. 

c. Estime o modelo probit com base nos dados transformados e compare os resultados com 
aqueles baseados nos dados originais. 

15.13. Uma vez que R 2 como medida da qualidade do ajustamento nao e particularmente adequado 
para os modelos de variaveis dependentes dicotomicas, uma alternativa sugerida e o teste x 2 
descrito a seguir: 



em que N, = numero de observances na /-esima celula 


* BOWEN, William G.; BOK, Derek. The shape of the river: long term consequences of considering race in college 
and university admissions. Princeton, NJ.: Princeton University Press, 1998. p. 381. 
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TABELA 15.21 Modelo de regressao logistica para prever a taxa de graduaqao dos alunos da turma que entrou em 1989 


Todos os matriculados 


Somente negros 



Estimativa dos 

Erro 

Razao de 

Estimativa dos 

Erro 

Razao de 

Variaveis 

parametros 

padrao 

chances 

parametros 

padrao 

chances 

Intercepto 

0,957 

0,052 

— 

0,455 

0,112 

— 

Mulher 

0,280 

0,031 

1,323 

0,265 

0,101 

1,303 

Negro 

-0,513 

0,056 

0,599 




Hispanico 

-0,350 

0,080 

0,705 




Asiatico 

0,122 

0,055 

1,130 




Outras ra^as 

-0,330 

0,104 

0,719 




SAT > 1,299 

0,331 

0,059 

1,393 

0,128 

0,248 

1,137 

SAT 1.200-1.299 

0,253 

0,055 

1,288 

0,232 

0,179 

1,261 

SAT 1.100-1.199 

0,350 

0,053 

1,420 

0,308 

0,149 

1,361 

SAT 1.000-1.099 

0,192 

0,054 

1,211 

0,141 

0,136 

1,151 

SAT nao disponivel 

-0,330 

0,127 

0,719 

0,048 

0,349 

1,050 

Os 10% melhores 

0,342 

0,036 

1,407 

0,315 

0,117 

1,370 

da turma 







Classifica^ao no segundo grau 

-0,065 

0,046 

0,937 

-0,065 

0,148 

0,937 

nao disponivel 







Altos status socioeconomico 

0,283 

0,036 

1,327 

0,557 

0,175 

1,746 

Baixo status socioeconomico 

-0,385 

0,079 

0,680 

- 0,305 

0,143 

0,737 

Status socioeconomico desconhecido 0,110 

0,050 

1,116 

0,031 

0,172 

1,031 

SEL-1 

1,092 

0,058 

2,979 

0,712 

0,161 

2,038 

SEL-2 

0,193 

0,036 

1,212 

0,280 

0,119 

1,323 

Falculdade frequentadas 

- 0,299 

0,069 

0,742 

0,158 

0,269 

1,171 


por mulheres 
Numero de observances 
-2 log verossimilhanga 
Restrita 
Irrestrita 
Qui-quadrado 


32.524 

31.553 

30.160 

1.393 com 18 graus de liberdade 


2.354 

2.667 

2.569 

98 com 14 graus de liberdade 


Notas: os coeficientes em negrito sao significativos no nivel de 0,05; outros coeficientes nao sao. As categorias omitidas no modelo sao brancos, homens, SAT < 1.000, os 
demais 90% do segundo grau, SES medio, SEL-3, instituigao mista. As notas de graduagao referem-se aos 6 primeiros anos de estudo, como definido nas notas da Tabela 
D.3.1 do Apendice D. As categorias de seletividade institucional sao definidas nas notas da Tabela D.3.1 do Apendice D. Veja o Apendice B para definigao do status socio¬ 
economico (SES). 

SEL-1 = instituigdes com notas medias combinadas do SAT de 1.300 e mais. 

SEL-2 = instituigdes com notas medias combinadas do SAT entre 1.150 e 1.299. 

SEL-3 = instituigdes com notas medias combinadas do SAT abaixo de 1.150. 

Fonte: BOWEN e BOK, op. cit., p. 381. 


Pi = probabilidade efetiva da ocorrencia de um evento ( = «,//V,) 

P/ = probabilidade estimada 

G = numero de celulas (o numero de m'veis em que X, e medido, por exemplo, 10 na Tabela 
15.4) 

Podemos mostrar que, para amostras grandes, y 2 e distribuldo de acordo com uma distribuiijao 
X 2 com (G — k ) graus de liberdade, em que k 6 o numero de parameters no modelo estimado 
(k < G ). 

Aplique o teste y 1 anterior a regressao (15.7.1) e comente sobre a qualidade resultante do ajus- 
tamento e compare-com o valor de R 2 reportado. 

15.14. A Tabela 15.22 apresenta dados sobre os resultados de aspersao de rotenone em diversas 
concentra 9 oes sobre macros de crisantemos de cerca de 50 flores. Desenvolva um modelo 
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adequado para expressar a probabilidade de as flores morrerem como tlmgao do log de X, o 
log de dosagem, e comente os resultados. Calcule tambem o teste x 2 do ajustamento discuti- 
do no Exerclcio 15.13. 

15.15. Treze candidados a um programa de pos-graduagao tiveram pontua£oes quantitativas em 
provas escritas e orais no GRE conforme a Tabela 15.23. Seis estudantes foram admitidos no 
programa. 

a. Use o MPL para prever a probabilidade de admissao ao programa com base em pontua£oes 
quantitativas em provas escritas e orais no GRE. 

b. Este e um modelo satisfatorio? Em caso negativo, quais alternativas voce sugere? 


TABELA 15.22 

Estudo de toxicidade Concentrafao, 


do Rotenone em 

Miligramas 

por litro 

Total, 

Morte, 


Crisantemos 

X 

log (X) 

Ni 

n. 

Pi= nM 

Fonte: FENNET, D. J. 

2,6 

0,4150 

50 

6 

0,120 

Probit analysis. Londres: 

3,8 

0,5797 

48 

16 

0,333 

Cambridge University Press, 

1964. 

5,1 

0,7076 

46 

24 

0,522 


7,7 

0,8865 

49 

42 

0,857 


10,2 

1,0086 

50 

44 

0,880 


TABELA 15.23 

Pontuacao do GRE 

Fonte: MORRISON, Donald 
F. Applied linear statistical 
methods. Englewood Cliffs, 
NJ.: Prentice-Hall, Inc., 

1983, p. 279 (adaptado). 



Pontuagao no teste de aptidao 

Admissao 




no curso 

Numero do aluno Quantitativa, Q 

Verbal, P 

(Sim = 1, Nao 

1 

760 

550 

1 

2 

600 

350 

0 

3 

720 

320 

0 

4 

710 

630 

1 

5 

530 

430 

0 

6 

650 

570 

0 

7 

800 

500 

1 

8 

650 

680 

1 

9 

520 

660 

0 

10 

800 

250 

0 

11 

670 

480 

0 

12 

670 

520 

1 

13 

780 

710 

1 


15.16. Para estudarem a eficacia de um cupom de desconto no prepo de uma embalagem de 6 garra- 
fas de dois litres de regrigerante, Douglas Montgomery e Elizabeth Peck coletaram os dados 
que aparecem na Tabela 15.24. Uma amostra de 5.500 foi elaborada selecionando aleatoria- 
mente 11 categorias de desconto e distribuindo entre elas grupos de 500 consumidores. A va¬ 
riavel de resposta era verificar se os consumidores resgatavam os cupons no prazo de um 
mes. 

a. Veja se o modelo logit encaixa-se nos dados, tratando a taxa de resgate como variavel de- 
pendente e o desconto como variavel explanatoria 

b. Veja se o modelo probit funciona tao bem quanto o logit. 
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TABELA 15.24 

Desconto no prefo 

Tamanho da amostra 

Numero de cupons resgastados 

Pre§o de refrigerantes 
com cupom de 

x,c 

N, 

t>i 

desconto 

5 

500 

100 


7 

500 

122 

Fonte: MONTGOMERY, 

9 

500 

147 

Douglas C.; PECK, 

Elizabeth A. Introduction to 

11 

500 

176 

linear regression analysis. 

13 

500 

211 

Nova York: John Wiley & 

15 

500 

244 

Sons, 1982, p. 243 (notagao 

17 

500 

277 

alterada). 

19 

500 

310 


21 

500 

343 


23 

500 

372 


25 

500 

391 


c. Qual a taxa de resgate prevista se o desconto no pre?o for de 17 centavos? 

d. Calcule o desconto no pre?o para o qual 70% dos cupons serao resgatados. 

15.17. Para descobrirem quem tern conta bancaria (conta corrente, poupan£a etc.) e quern nao tem, 
John Caskey e Andrew Peterson estimaram um modelo probit para os anos de 1977 e 1989, 
usando os dados sobre famflias norte-americanas. Os resultados sao dados na Tabela 15.25. 
Os valores dos coeficientes angulares da tabela medem o efeito implicito de uma variac^ao 
unitaria em um regressor sobre a probabilidade de uma famflia ter conta em banco, sen- 
do esses efeitos marginais calculados como os valores medios dos regressores inclufdos 
no modelo. 

a. Para 1977, qual o efeito do estado civil em ter uma conta bancaria? E para 1989? Esses re¬ 

sultados fazem sentido, do ponto de vista economico? 

b. Por que o coeficiente para a variavel minoria e negativo nos anos de 1977 e 1989? 

c. Como podemos explicar o sinal negativo para a variavel numero de filhos? 

d. O que sugere o qui-quadrado dado na tabela? ( Dica: veja o Exercicio 15.13.) 

15.18. Estudo de Monte Carlo. Para ajudar a entender o modelo probit, William Becker e Donald 
Waldman consideraram o seguinte: 

E(Y \X) = - 1+ 3X 

Entao, seja Y t = — 1 + 3X + e,-, em que e, e normal padrao (com media zero e variancia uni¬ 
taria), eles geraram uma amostra de 35 observa£6es, segundo a Tabela 15.26. 

a. Dos dados em YeX desta tabela, e posstvel calcular um MPL? Lembre-se de que o verda- 
deiro E(Y\X) = -1 +3 A. 

b. Dado X = 0,48, estime E(Y\ X = 0,48) e compare-o com o verdadeiro E(Y\ X = 0,48). Note 
que X = 0,48. 

c Usando os dados em Y* e X da Tabela 15.26, calcule um modelo probit. Voce pode usar o 
programa estatistico que preferir. O modelo probit estimado dos autores e o seguinte: 

Y* = - 0,969 + 2,764A, 


Descubra o P(Y* = 1 | X = 0,48), isto e, P(Yi > 0 | X = 0,48). Veja se a sua resposta esta 
de acordo com a resposta dos autores de 0,64. 


* BECKER, William E.; WALDMAN, Donald M. "A graphical interpretation of probit coefficients." lournal of Economic 
Education, 1989. v. 20, n. 4, p. 371-378. 
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TABELA 15.25 Regressoes probit em que a variavel dependente e ter deposito em conta corrente 


Dados de 1977 Dados de 1989 



Coeficiente 

lnclina 9 ao implfcita 

Coeficiente 

lnclina 9 ao implfcita 

Constante 

-1,06 


-2,20 



(3,3)* 


(6,8)* 


Renda (milhares de dolares de 1991) 

0,030 

0,002 

0,025 

0,002 


(6,9) 


(6,8) 


Casado 

0,127 

0,008 

0,235 

0,023 


(0,8) 


0,7) 


Numero de filhos 

-0,131 

-0,009 

-0,084 

-0,008 


(3,6) 


(2,0) 


Idade do chefe de familia (HH) 

0,006 

0,0004 

0,021 

0,002 


0,7) 


(6,3) 


Grau de escolaridade (HH) 

0,121 

0,008 

0,128 

0,012 


(7,4) 


(7,7) 


Homem (HH) 

-0,078 

- 0,005 

-0,144 

-0,011 


(0,5) 


(0,9) 


Minoria 

-0,750 

-0,050 

-0,600 

-0,058 


(6,8) 


(6,5) 


Empregado 

0,186 

0,012 

0,402 

0,039 


(1,6) 


(3,6) 


Tem casa propria 

0,520 

0,035 

0,522 

0,051 


(4,7) 


(5,3) 


Log da verossimilhan^a 

-430,7 


-526,0 


Estatistica qui-quadrado 

408 


602 


(Ho: Todos os coeficientes, exceto 





a constante, iguais a zero) 





Numero de observagoes 

2.025 


2.091 


Porcentagem na amostra 





com previsoes corretas 

91 


90 



*Numeros entre parenteses sao estatfsticas t. 

Fonte: CASKEY, John P.; PETERSON, Andrew. “Who has a bank account and who doesn’t: 1977 and 1989.” Trabalho de pesquisa 93-10, Federal Reserve Bank of 
Kansas City, out. 1993. 


TABELA 15.26 

Dados hipoteticos 

Y 

-0,3786 

1,1974 

Y* 

0 

1 

X 

Y 

-0,3753 

1,9701 

Y* 

X 

gerados pelo modelo 
K=-l+3X + ee 

Y* = 1 se Y>0 

0,29 

0,59 

0 

1 

0,56 

0,61 

-0,4648 

0 

0,14 

-0,4054 

0 

0,17 

1,1400 

1 

0,81 

2,4416 

1 

0,89 

Fonte: BECKER, William 

0,3188 

1 

0,35 

0,8150 

1 

0,65 

E.; WALDMAN, Donald 

2,2013 

1 

1,00 

-0,1223 

0 

0,23 

M. “A graphical 
interpretation of probit 

2,4473 

1 

0,80 

0,1428 

1 

0,26 

coefficients.” Journal of 

0,1153 

1 

0,40 

-0,6681 

0 

0,64 

Economic Education, 1989, 

0,4110 

1 

0,07 

1,8286 

1 

0,67 

Tabela 1, p. 373. 

2,6950 

1 

0,87 

-0,6459 

0 

0,26 


2,2009 

1 

0,98 

2,9784 

1 

0,63 


0,6389 

1 

0,28 

-2,3326 

0 

0,09 


4,3192 

1 

0,99 

0,8056 

1 

0,54 


-1,9906 

0 

0,04 

-0,8983 

0 

0,74 


-0,9021 

0 

0,37 

-0,2355 

0 

0,17 


0,9433 

1 

0,94 

1,1429 

1 

0,57 


-3,2235 

0 

0,04 

-0,2965 

0 

0,18 


0.1690 

1 

0.07 
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d. O desvio padrao da amostra dos valores X da Tabela 15.26 e 0,31. Qual a variagao prevista na 
probabilidade se X e um desvio padrao acima do valor medio, isto e, o que e P(Y* = 1 | X = 
0,79)? A resposta dos autores e 0,25. 

15.19. A Tabela 15.27 do site do livro apresenta dados para 2 mil mulheres a respeito do trabalho 
(1 = sea mulher trabalhar, 0 = se nao trabalhar), idade, estado civil (1 = casada, 0 = nao 
casada), niimero de filhos e escolaridade (numero de anos de estudo). De um total de 2 mil 
mulheres, 657 foram registradas ganhando salario. 

a. Com esses dados, estime o modelo de probabilidade linear (MPL). 

b. Com os mesmos dados, estime um modelo logit e obtenha os efeitos marginais das diversas 
variaveis. 

c. Repita ( b ) para o modelo probit. 

d. Qual modelo voce escolheria? Por que? 

15.20. Para o exemplo de fumantes discutido no texto (veja a Secgao 15.10), baixe os dados do site 
do livro na Tabela 15.28. Veja se o produto da escolaridade pela renda (o efeito interagao) tem 
alguma influencia na probabilidade de tornar-se fumante. 

15.21. Baixe os dados Benign, que se referem a Tabela 15.29 do site do livro. A variavel cancer e 
uma variavel dummy, em que 1 = tinha cancer de mama e 0 = nao tinha cancer de mama. 
Usando as variaveis idade (= idade da pessoa), HIGD (= grau de escolaridade), CHK (= 0 se 
a pessoa nao fazia exames regulares e = 1 se a pessoa fazia exames regulares), AGPI (= idade 
da primeira gravidez), abortos (= numero de abortos) e peso (= peso da pessoa), efetue uma 
regressao logfstica para concluir se essas variaveis sao uteis, do ponto de vista estatfstico, para 
prever se uma mulher contraira cancer de mama ou nao. 



15A.1 Estimativa da maxima verossimilhan^a dos 

modelos logit e probit para dados individuais 
(nao agrupados)* 


Como no texto, suponha que estejamos interessados em calcular a probabilidade de um individuo ter uma 
casa, dada sua renda X. Consideramos que essa probabilidade possa ser expressa pela fungao logistica (15.5.2), 
reproduzida abaixo por conveniencia. 

P = 1 ( 1 ) 

1 1 + e -(fh+lhX t ) 

Nao observamos diretamente P h mas apenas o resultado Y = 1, se um individuo tiver casa, 0, se nao tiver. 
Uma vez que cada Y t e uma variavel aleatoria de Bernoulli, podemos escrever 


Pr(lj = 1) = Pi 


( 2 ) 

( 3 ) 


Pr(Ij = 0) = (1 - Pi) 


Suponha que tenhamos uma amostra aleatoria de n observagoes. Se_/)(!)) denotar a probabilidade de que Y t 
= 1 ou 0, a probabilidade conjunta de observar os n valores Y, isto e,f(Yi, Y 2 , . . . , T„) e dada como: 


‘Dados fornecidos sobre 50 mulheres que receberam o diagnostico de cancer de mama e 150 com recomenda- 
gao de controles para idade, com tres controles por caso. Entrevistadores treinados administraram um questio- 
nario estruturado, padronizado, para coletarem informagoes de cada pessoa (veja PASTIDES, et al. [1983] e 
PASTIDES, et al. [1985]). 

t A discussao a seguir baseia-se em NETER, John; KUTNER, Michael H.; NACHSTEIM, Christopher ].; WASSER- 
MAN, William. Applied linear statistical models. 4. ed. Irwin, 1996. p. 573-574. 
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n 


n 


f(Y\, y 2 , ..y „)= n f(Yi) = n p !‘Q - p ^'~ Yi 


( 4 ) 


em que El e o operador de produtorio. Note que podemos escrever a fungao de densidade da probabilidade 
conjunta como um produto das fungoes de densidade individuals, porque cada 5j tem a mesma fungao densida¬ 
de (logistica). A probabilidade conjunta da Equagao (4) e conhecida como fungao de verossimilhanga (FV). 
A Equagao (4) e um pouco trabalhosa para manipular, mas se tomarmos o seu logaritmo natural, obtemos 

a fungao de verossimilhanga logaritmica (FVL): 


n 


In f(J u 7 2 , , 7„) = J2 \- Y i In P, + (1 - Y t ) ln(l - P,)] 


n 



( 5 ) 



Da Equagao (1) e facil verificar que 


1 


( 6 ) 



bent como 



( 7 ) 


Usando as EquagSes (6) e (7), podemos escrever a FVL (5) como: 


n 


n 



( 8 ) 


Como podemos depreender da Equagao (8), a fungao de verossimilhanga logaritmica e uma fungao dos 
parametros fi i e visto que os A,- sao conhecidos. 

Na MV nosso objetivo e maximizar a FV (ou FVL), ou seja, obter os valores dos parametros desconhecidos 
de modo que a probabilidade de observar os 7 dados seja a mais alta possivel. Com essa finalidade, diferenciamos 
a Equagao (8) parcialmente com relagao a cada incognita, igualamos as expressdes resultantes a zero e resolve- 
mos. Podemos, entao, aplicar a condigao de maximizagao de segunda ordem para verificar se os valores dos para¬ 
metros que obtivemos maximizam realmente a FV. 

Portanto, temos de diferenciar a Equagao (8) com relagao a e fi 2 e prosseguir como indicado. Como voce 
percebera, as expressSes resultantes tomam-se altamente nao lineares nos parametros e nao podem ser obtidas 
solugdes expliticas. E por isso que temos de usar um dos metodos de estimagao nao linear discutidos no capitulo 
anterior para obter solugoes numericas. Uma vez que os valores numericos /3 l e f} 2 sao obtidos, podemos calcular 
facilmente a Equagao (1). 

O procedimento de maxima verossimilhanga para o modelo probit e semelhante aquele para o modelo logit, 
exceto que na Equagao (1) usamos a fungao de distribuigao acumulada (FDA) em vez da fungao de distribuigao 
acumulada logistica. A expressao resultante toma-se bem complicada, mas a ideia geral e a mesma. Logo, nao 
continuaremos o procedimento. 







Capitulo 

Modelos de regressao com 
dados em painel 

No Capitulo 1 discutimos brevemente os tipos de dados que em geral estao dispom'veis para a 
analise aplicada: as series temporais, os cortes transversais e os paineis. Nas series temporais, 
observamos os valores de uma ou mais variaveis em um periodo de tempo (como o PNB ao longo de 
varios trimestres ou anos). Nos dados de corte transversal, coletam-se dados relativos a uma ou mais 
variaveis para varias unidades ou entidades amostrais no mesmo periodo (como as taxas de crimina- 
lidade para os 50 estados norte-americanos, em determinado ano). Nos dados em painel, a mesma 
unidade de corte transversal (uma famflia, uma empresa, um estado) e acompanhada ao longo do 
tempo. Em sintese, os dados em painel tem uma dimensao espacial e outra temporal. 

Ja vimos exemplos disso na Tabela 1.1, em que apresentamos dados da produpao e dos pre?os dos 
ovos nos 50 Estados norte-americanos no periodo de 1990 e 1991. Para cada um desses anos, os dados 
de produ 5 ao e dos pre 90 s dos ovos representam uma amostra de corte transversal. Para cada Estado 
ha duas observa 9 oes de series temporais para produ 9 ao de ovos e seus pre 90 s. Assim, temos um total 
de 100 observa 5 oes (combinadas) de produgao e prccos de ovos. 

Outro exemplo de dados em painel foi apresentado na Tabela 1.2, que content dados sobre inves- 
timento, valor da empresa e estoque de capital para quatro empresas, referentes ao periodo de 1935-1954. 
Os dados para cada empresa no periodo de 1935-1954 constituem dados em serie temporal, com 20 
observa 9 oes; os dados para todas as quatro empresas referentes a determinado ano sao um exemplo 
de dados de corte tranversal, com apenas quatro observa 9 oes; e dados para todas as empresas e todos 
os anos sao exemplos de dados em painel, com um total de 80 observa 9 oes. 

Ha outros nomes para dados em painel, como dados empilhados (do ingles, pooled data, agrupan- 
do observa 9 oes de series temporais e de corte transversal), combina 9 ao de series temporais e dados 
de corte transversal, painel de microdados, dados longitudinals (um estudo ao longo do tempo de 
uma variavel ou grupo de sujeitos), analise historica de eventos (estudar o movimento ao longo do 
tempo de individuos atraves de sucessivos estados ou cond^oes), e analise de corte (por exemplo, 
acompanhar a carreira dos formandos de 1965 de uma escola de administra 9 ao). Embora haja varia- 
9 oes sutis, todos esses nomes conotam essencialmente o movimento no tempo de unidades de corte 
transversal. Usamos o termo dados em painel em sentido generico para incluir um ou mais desses 
termos e chamaremos esses modelos de regressao baseados em tais dados de modelos de regressao 
com dados em painel. 

Os dados em painel agora estao sendo usados cada vez mais em pesquisa economica. Alguns dos 
conjuntos de dados em painel conhecidos sao: 

1. O Panel Study of Income Dynamics (PSID) conduzido pelo Instituto de Pesquisa Social 
da Universidade de Michigan. Iniciado em 1968, a cada ano o Instituto coleta dados sobre 
cerca de 5 mil familias, relativos a diversas variaveis socioeconomicas e demograficas. 

2. O Escritorio do Censo do Departamento de Comercio conduz uma pesquisa similar ao PSID, 
chamada de Survey of Income and Program Participation (SIPP). Quatro vezes por ano 
os entrevistados respondem sobre sua cond^ao economica. 
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3. O German Socio-Economic Panel (GESOEP) estudou 1.761 indivlduos no perfodo entre 
1984 e 2002. Informagoes sobre ano de nascimento, genera, satisfa^ao com a vida, estado 
civil, ganhos com trabalho e horas de trabalho por ano foram coletadas para cada indivlduo 
para o perfodo de 1984 a 2002. 

Ha tambem muitos outros levantamentos conduzidos por varias agendas governamentais, 
como: 

Household, Income and Labor Dynamics in Australia Survey (HILDA) 

British Household Panel Survey (BHPS) 

Korean Labor and Income Panel Study (KLIPS) 

Vale uma advertencia: o topico de regressoes de dados em painel e vasto e algumas operates 
matematicas e estatisticas sao bastante complicadas. So pretendemos abordar algumas no 9 oes essen- 
ciais dos modelos de regressao de dados em painel, deixando os detalhes para as referencias. * 1 Mas 
saiba que algumas dessas referencias sao altamente tecnicas. Felizmente, programas simples como 
LIMDEP, PC-GIVE, SAS, STATA, SHAZAM e EViews, entre outros, tornaram a tarefa de imple- 
mentar regressoes de dados em painel bem facil. 


16.1 Por que dados em painel? 

Quais as vantagens dos dados em painel sobre dados de corte transversal ou de series tem- 
porais? Baltagi enumera as seguintes vantagens dos dados em painel: 2 3 4 

1. Uma vez que os dados em painel se relacionam a indivlduos, empresas, Estados, palses etc., 
com o tempo, tende a haver heterogeneidade nessas unidades. As tecnicas de estimagao dos 
dados em painel podem levar em considera£ao a heterogeneidade explicitamente, permitindo 
variaveis especlficas ao sujeito, como mostraremos rapidamente. Usamos o termo sujeito em 
sentido generico, para incluir microunidades como indivlduos, empresas, Estados e palses. 

2. Combinando series temporais com observa£6es de corte transversal, os dados em painel ofere- 
cem “dados mais informativos, maior variabilidade, menos colinearidade entre variaveis, mais 
graus de liberdade e mais eficiencia”. 

3. Estudando repetidas observa£6es em corte transversal, os dados em painel sao mais adequa- 
dos para examinar a dinamica da mudan^a. Periodos de desemprego, rotatividade no empre- 
go e mobilidade da mao de obra sao analisados de maneira mais apropriada com dados em 
painel. 

4. Os dados em painel podem detectar e medir melhor os efeitos que simplesmente nao podem 
ser observados em um corte transversal puro ou em uma serie temporal pura. Por exemplo, 
os efeitos das leis de salario mlnimo sobre o emprego e ganhos poderao ser estudados mais 
adequadamente se incluirmos ondas sucessivas de aumentos de salarios nos salarios mlni- 
mos estadual e/ou federal. 


1 Algumas das referencias sao CHAMBERLAIN, G. "Panel data." In: Handbook of econometrics, v. II; GRIUCHES, Z.; 
INTRILIGATOR, M. D. (Org.). North-Holland Publishers, 1984, cap. 22; HSIAO, C. Analysis of panel data. Cambrid¬ 
ge University Press, 1986; JUDGE, G. G.; HILL, R. C.; GRIFFITHS, W. E.; LUTKEPOHL, H.; LEE, T. C. Introduction to 
the theory and practice of econometrics, 2. ed. Nova York: John Wiley & Sons, 1985, cap. 11; GREENE, W. H. Econo¬ 
metric analysis. 6. ed. Englewood Cliffs, NJ: Prentice-Hall, 2008, cap. 9; BALTAGI, Badi H. Econometric analysis of 
panel data. Nova York: John Wiley and Sons, 1995; e WOOLDRIDGE, J. M. Econometric analysis of cross section 
and panel data. Cambridge, Mass.: MIT Press, 1999. Para um tratamento detalhado do assunto com aplica- 
foes empfricas, veja FREES, Edward W. Longitudinal and panel data: analysis and applications in the social 
sciences. Nova York: Cambridge University Press, 2004. 

2 BALTAGI, op. cit., p. 3-6. 
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5. Dados em painel permitem estudar modelos de comportamento mais complicados. Por 
exemplo, fenomenos como economias de escala e mudanga tecnologica podem ser mais bem 
conduzidos pelos dados em painel do que apenas pelo corte transversal ou pelas series tem¬ 
poral s. 

6. Ao disponibilizar os dados referentes a milhares de unidades, os dados em painel podem 
minimizar o vies que poderia resultar se estivessemos trabalhando com um agregado de in- 
divfduos ou empresas. 

Em suma, os dados em painel podem enriquecer a analise aplicada ao ponto de ser impossfvel 
usarmos apenas dados de series temporais ou de corte transversal. Isso nao deve sugerir que nao haja 
problemas com a modelagem com dados em painel. Discutiremos esses problemas depois de tratar- 
mos da teoria e apresentarmos alguns exemplos. 


16.2 Dados em painel: um exemplo ilustrativo 

Para introduzirmos o assunto, consideremos os dados apresentados na Tabela 16.1, no site do li- 
vro-texto, coletados originalmente pelo Professor Moshe Kim e reproduzidos de William Greene. 3 
Os dados analisam os custos de seis empresas de transporte aereo para o perfodo de 1970-1984, para 
um total de 90 observagoes de dados em painel. 

As variaveis sao definidas como: I = nome da empresa aerea; T = ano; Q = produgao, em receita 
por milhas/passageiro, um numero fndice; CT = custo total, em $ 1.000; PF = prego do combustrvel; 
e LF = fator de carga, a utilizagao media da capacidade do voo. 

Suponha que estejamos interessados em descobrir como o custo total ( CT) comporta-se em rela- 
gao ao produto (Q), ao prego do combustrvel (PF) e ao fator de carga (LF). Em resumo, desejamos 
estimar uma fungao de custo da empresa aerea. Como calculamos essa fungao? Evidentemente, po- 
demos estimar a fungao de custo para cada empresa aerea usando os dados para 1970-1984 (uma re¬ 
gressao de series temporais). Isso pode ser feito com o procedimento habitual de mfnimos quadrados 
ordinarios (MQO). Teremos ao todo seis fungoes de custo, uma para cada empresa aerea. Mas entao 
desprezamos as informagoes sobre as outras empresas aereas que operam no mesmo ambiente (regu- 
lador). 

Tambem podemos estimar uma fungao de custo de corte tranversal (uma regressao de corte trans¬ 
versal). Teremos ao todo 15 regressoes de corte transversal, uma para cada ano. Mas isso nao faria 
muito sentido no atual contexto, pois temos apenas seis observagoes por ano e ha tres variaveis ex- 
planatorias (mais o termo de intercepto); teremos poucos graus de liberdade para uma analise signi- 
ficativa. Tambem, nao iremos “explorar” a natureza do painel para nossos dados. 

Os dados em painel de nosso exemplo sao chamados de painel balanceado; um painel e dito 
balanceado se cada unidade de corte transversal (empresas, individuos etc.) em o mesmo numero de 
observagoes. Se cada unidade tiver um numero diferente de observagoes, teremos um painel desba- 
lanceado. Na maior parte deste capftulo, lidaremos com paineis balanceados. Na literatura de painel 
de dados tambem temos os termos painel curto e painel longo. Em um painel curto, o numero de 
sujeitos de corte transversal, N, e maior que o numero de perfodos de tempo, T. Em um painel longo, 
T e maior que N. A medida que tivermos um painel curto ou longo, escolheremos a tecnica de estima- 
gao adequada. 

Quais sao as opgoes? Ha quatro possibilidades: 

1. Modelo MQO para dados empilhados (pooled data). Simplesmente empilhamos todas as 90 
observagoes e estimamos uma regressao “grande”, desprezando a natureza de corte transversal e 
de series temporais de nossos dados. 


3 GREENE, William H. Econometric analysis. 6. ed., 2008. Disponfvel em: http://pages.stern.nyu.edu/-wgreen/Text/ 
econometricanalysis.htm. 




590 


Parte tres 


Topicos em econometria 


2. O modelo de minimos quadrados com variaveis dummies para efeitos fixos (MQVD). 

Combinamos todas as 90 observagoes, mas deixamos que cada unidade de corte transversal 
(empresa aerea em nosso exemplo) tenha sua propria variavel dummy (intercepto). 

3. O modelo de efeitos fixos dentro de um grupo (fixed effects within-grup model). Combi¬ 
namos todas as 90 observances, mas para cada empresa aerea expressamos cada variavel 
como um desvio de seu valor medio e, entao, estimamos uma regressao de MQO contra es¬ 
ses valores corrigidos para a media. 

4. O modelo de efeitos aleatorios (MEA). Ao contrario do modelo MQVD, em que permiti- 
mos que cada empresa aerea tenha seu proprio valor de intercepto, pressupomos que os va¬ 
lores de intercepto sejam extraidos aleatoriamente de uma populagao bem maior de empresas 
aereas. 

Agora discutiremos cada um desses metodos usando os dados da Tabela 16.1. (Veja o site do li- 
vro-texto.) 


16.3 Modelo de regressao MQO para dados empilhados on modelo 
de coeficientes constantes 

Considere o modelo a seguir: 


CT it = + p 2 Qu + faPF u + p 4 LF it + u 

i= 1 , 2 ,..., 6 
t= 1.2.15 


(16.3.1) 


em que i e o i-esimo indivfduo eteo periodo de tempo para as variaveis que definimos anteriormente. 
Escolhemos a fungao de custo linear para fins ilustrativos, mas no Exercicio 16.10 cabera ao leitor esti- 
mar uma fungao log-linear ou double-log, e neste ultimo caso os coeficientes angulares darao as estima- 
tivas de elasticidade. 

Note que combinamos todas as 90 observances, mas estamos pressupondo que os coeficientes de 
regressao sejam os mesmos para todas as linhas aereas. Ou seja, nao ha distincao entre as empresas 
aereas — uma linha aerea e tao boa quanto a outra, um pressuposto que pode ser diflcil de manter. 

Supoe-se que as variaveis explanatorias sejam nao estocasticas. Se forem estocasticas, nao serao 
correlacionadas com o termo de erro. As vezes supoe-se que as variaveis explanatorias sejam estri- 
tamente exogenas. Uma variavel sera estritamente exogena se nao depender de valores correntes, 
passados efuturos do termo de erro u it . 

Supoe-se ainda que o termo de erro seja u it ~ iid( 0, cr 2 ), isto e, que ele seja distribui'do identica e 
independentemente com media zero e variancia constante. Com a finalidade de testar a hipotese, 
podemos considerar que o termo de erro tambem seja normalmente distribuldo. Observe a notagao 
com duplo subscrito na Equagao (16.3.1), que deveria ser autoexplicativa. 

Primeiro vamos apresentar os resultados da equagao estimada (16.3.1) e depois discutiremos al- 
guns dos problemas com esse modelo. Os resultados da regressao baseados no EViews, versao 6, sao 
apresentados na Tabela 16.2. 

Se examinarmos os resultados da regressao para dados empilhados (pooled regression) e apli- 
carmos os criterios convencionais, veremos que todos os coeficientes de regressao nao so sao alta- 
mente significativos, em termos estatisticos, mas tambem estao de acordo com as expectativas e 
notaremos tambem que o valor R 2 6 muito alto. O unico “deslize” e que a estatlstica estimada de 
Durbin-Watson e bem baixa, sugerindo que talvez nao haja autocorrelagao e/ou correlagao espacial 
nos dados. Evidentemente, como sabemos, um Durbin-Watson baixo tambem se deveria a erros de 
especificagao. 
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TABELA 16.2 


Dependent Variable: C 

Method: Least Squares 

Included observations: 90 


Coefficient 

Std. Error t Statistic 

Prob. 

C (intercept) 


1158559. 

360592.7 3.212930 

0.0018 

Q 


2026114. 

61806.95 32.78134 

0.0000 

PF 


1.225348 

0.103722 11.81380 

0.0000 

LF 

- 

3065753. 

696327.3 -4.402747 

0.0000 

R -squared 


0.946093 

Mean dependent var. 

1122524. 

Adjusted i?-squared 

0.944213 

S.D. dependent var. 

1192075. 

S.E. of regression 

281559.5 

F-statistic 

503.1176 

Sum squared resid. 

6.82E+12 

Prob. (F-statistic) 

0 . 000000 




Durbin-Watson 

0.434162 


O principal problema desse modelo e que ele nao distingue entre as diversas empresas aereas nem 
diz se a resposta do custo total as variaveis explanatorias ao longo do tempo e a mesma para todas as 
empresas. Em outras palavras, ao juntarmos diferentes empresas aereas em perfodos diferentes, ca- 
muflamos a heterogeneidade (individualidade ou originalidade) que possa existir entre as empresas 
aereas. Outra forma de afirmar isso e que a individualidade de cada sujeito esta incluida no termo de 
erro, u it . Em consequencia, e bem possfvel que o termo de erro possa estar correlacionado com alguns 
dos regressores inckudos no modelo. Se for esse o caso, os coeficientes estimados na Equafao (16.3.1) 
podem ser tendenciosos e inconsistentes. 

Lembre-se de que uma das hipoteses importantes do modelo classico de regressao linear e que 
nao haja correlagao entre os regressores e o termo de erro. 

Para entendermos como o termo de erro pode estar correlacionado com os regressores, vamos 
considerar a seguinte revisao do modelo (16.3.1): 

CT it = Pi + P 2 P Fit + PiLFjt + P^Mj, + u if (16.3.2) 

em que a variavel adicional M = qualidade gerencial ou filosofia gerencial. Das variaveis incluidas na 
Equa£ao (16.3.2), apenas a variavel M e invariante no tempo (ou constante no tempo), porque varia 
entre os indivfduos, mas e constante ao longo do tempo para determinado indivfduo (empresa aerea). 

Embora seja invariante em termos de tempo, a variavel M nao e diretamente observavel e, portan- 
to, nao podemos medir sua contribuifao para a ftm£ao de custo. Podemos, entretanto, fazer isso indi- 
retamente, se escrevermos a Equagao (16.3.2) como 


CT it = Pi + p 2 PF it + PiLFit + a, + u it (16.3.3) 

em que a,-, chamado efeito nao observado, ou heterogeneidade, reflete o impacto de M sobre o custo. 
Note que por simplicidade mostramos apenas o efeito nao observado de M sobre o custo, mas na rea¬ 
lidade pode haver mais efeitos nao observados, por exemplo, a natureza da propriedade (privada ou 
publica), se uma empresa e de capital aberto ou fechado, se o CEO e homem ou mulher etc. Embora 
tais variaveis possam diferir entre os indivfduos (empresas aereas), provavelmente permanecerao as 
mesmas para um dado indivfduo sobre todo o perfodo da amostra. 

Uma vez que a,- nao e diretamente observavel, por que nao considera-la aleatoria e incluf-la no 
termo de erro u it , e considerar o termo de erro v„ = a, + u it ? Agora escrevemos a Equa^ao (16.3.3) 
como: 


CT it - Pi + P2PF it + PiLF it + v it 


( 16 . 3 . 4 ) 
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Mas se o termo a, inclufdo no termo de erro v„ esta correlacionado com qualquer um dos regres- 
sores na Equa£ao (16.3.4), temos uma viola§ao de uma das hipoteses principals do modelo classico 
de regressao linear - ou seja, que o termo de erro nao esta correlacionado com os regressores. Como 
sabemos, nessa situa£ao, as estimativas de MQO nao sao apenas tendenciosas, mas tambem inconsis- 
tentes. 

Ha uma possibilidade real de que o a,- nao observavel esteja correlacionado com um ou mais re¬ 
gressores. Por exemplo, a direpao de uma empresa aerea pode ser perspicaz o suficiente para comprar 
combustivel na bolsa de futuros, a fim de evitar severas flutuafoes de pre?o. Isso tera o efeito de re- 
duzir o custo dos servi£os de transporte aereo. Como resultado dessa corrclagao, pode-se mostrar que 
cov ( v,„ v,j) = a 2 u \ t =t= s, que e diferente de zero, e, portanto, a heterogeneidade (nao observada) induz 
a autocorrelagao e teremos de prestar aten£ao nisso. Mostraremos mais tarde como esse problema 
pode ser corrigido. 

Portanto, a questao e como lidamos com efeitos nao observaveis, ou com a heterogeneidade, 
de modo que possamos obter estimativas consistentes e/ou eficientes dos parametros das variaveis de 
maior interesse, que sao produto, prcco do combustivel e fator de carga em nosso caso. Nosso inte- 
resse principal pode nao ser a obtengao do impacto das variaveis nao observaveis, porque elas 
permanecem as mesmas para um dado sujeito. E por isso que esses efeitos nao observaveis, ou a 
heterogeneidade, sao chamados de parametros de sujeira ( nuisance parameters). Como devemos 
proceder? Agora nos voltaremos para essa questao. 


16.4 O modelo de mmimos quadrados com variaveis dummy para 
efeitos fixos (MQVD) 

O modelo de minimos quadrados com variaveis dummy para efeitos fixos (MQVD) conta com 
a heterogeneidade entre individuos, permitindo que cada um tenha seu proprio intercepto, como mos- 
tra o modelo (16.4.1). Continuaremos com o nosso exemplo de empresas aereas. 


CT it - fin + Qu + PiPFi t + PaLFh + u it 

i= 1,2... ,6 ( 16 . 4 . 1 ) 

t= 1,2,..., 15 

Observe que colocamos o subscrito i no termo de intercepto para sugerir que os interceptos das 
seis empresas aereas podem ser diferentes. A diferen 9 a pode ser devida a aspectos especiais de 
cada uma, como estilo gerencial, filosofia gerencial, ou tipo de mercado que cada organizapao esta 
servindo. 

Na literatura especlfica, o modelo (16.4.1) e conhecido como modelo (de regressao) de efeitos 
fixos (MEF). O termo “efeitos fixos” deve-se ao fato de que, embora o intercepto possa diferir entre 
os individuos (no caso, seis empresas aereas), o intercepto de cada indivfduo nao varia com o tempo; 
ele e invariante no tempo. Note que, se tivessemos de escrever o intercepto como f J >|ele sugeriria 
que o intercepto de cada indivfduo e variante no tempo. Podemos observar que esse modelo dado na 
Equapao (16.4.1) pressupoe que os coeficientes (angulares) dos regressores nao variam entre indivi¬ 
duos nem com o tempo. 

Antes de prosseguirmos, pode ser util visualizarmos a difercnca entre o modelo de regressao para 
dados empilhados (pooled regression) e o modelo MQVD. Para simplificarmos, pressupomos que 
desejamos fazer a regressao do custo total apenas contra o produto. Na Figura 16.1 mostramos essa 
func;ao de custo estimada para duas empresas aereas separadamente, bem como a fun 5 ao de custo se 
agrupamos os dados para as duas empresas; isso equivale a desprezar os efeitos fixos. 4 Podemos ver 
da Figura 16.1 como a regressao com dados empilhados pode tornar tendenciosa a estimativa do 
(coeficiente) angular. 


4 Adaptado de notas nao publicadas de Alan Duncan. 
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FIGURA 16.1 

Vies decorrente do 
fato de ignorarem-se 
os efeitos fixos. 



Como permitimos que o intercepto (com efeito fixo) varie entre as empresas? Podemos fazer isso 
facilmente, usando a tecnica da variavel dummy, principalmente a tecnica das variaveis dummies 
de intercepto diferencial, que aprendemos no Capftulo 9. Agora escrevemos a Equaqao (16.4.1) 
como: 


CT lt - oq + a 2 D 21 + ot 2 D 2i + (X 4 D 41 + oisDsi + 
+ Pi Qu + foP Fu + P^LFit + u it 


(16.4.2) 


em que D 2i = 1 para a empresa aerea 2, 0 caso contrario; D 2i = 1 para a empresa aerea 3, 0 caso con¬ 
trario e assim por diante. Note que, uma vez que temos seis empresas aereas, introduzimos apenas 
cinco variaveis dummies para evitar cair na armadilha da variavel dummy (a situaqao de colineari- 
dade perfeita). Aqui estamos tratando a empresa aerea 1 como categoria de base, ou referenda. Evi- 
dentemente, podemos escolher qualquer empresa aerea como ponto de referenda. Como resultado, o 
intercepto oq e o valor do intercepto da empresa aerea 1 e os outros coeficientes a representam quanto 
os valores de intercepto das outras empresas aereas diferem daqueles da primeira. Assim, a 2 indica 
quanto o valor do intercepto da segunda empresa aerea difere de oq. A soma (oq + a 2 ) da o valor real 
do intercepto para a empresa 2. Os valores de intercepto das outras empresas aereas podem ser calcu- 
lados de forma semelhante. Lembre-se de que, se voce quiser introduzir uma variavel dummy para 
cada empresa, terd de excluir o intercepto (comum); caso contrario, caird na armadilha da variavel 
dummy. 

Os resultados do modelo (16.4.2) para nossos dados sao apresentados na Tabela 16.3. A primeira 
coisa a notar e que todos os coeficientes de intercepto diferencial sao altamente significativos estatis- 
ticamente, sugerindo que talvez as seis empresas aereas sejam heterogeneas e, portanto, os resultados 
da regressao para dados empilhados na Tabela 16.2 podem ser duvidosos. Os valores dos coeficientes 
angulares das Tabelas 16.2 e 16.3 tambem sao diferentes, novamente lancando duvidas sobre os re¬ 
sultados apresentados na Tabela 16.2. Parece que o modelo (16.4.1) e melhor que o (16.3.1). A pro- 
posito, note que o MQO aplicado a urn modelo de efeito fixo produz estimadores que sao chamados 
de estimadores de efeito fixo. 

Podemos fomecer um teste formal dos dois modelos. Em relaqao ao (16.4.1), o (16.3.1) e um 
modelo restrito, no sentido de que impoe um intercepto comum para todas as empresas aereas. Pode¬ 
mos usar o teste F restrito discutido no Capftulo 8. Usando a Formula (8.6.10), o leitor podera veri- 
ficar que neste caso o valor de f’e: 


F = 


(0,971642- 0,946093)/5 


14,99 


(1 - 0,971642)/81 
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TABELA 16.3 


Dependent Variable: TC 
Method: Least Squares 
Sample: 1-90 

Included observations: 90 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c (= 0 fi) 

-131236.0 

350777.1 

-0.374129 

0.7093 

Q 

3319023. 

171354.1 

19.36939 

0.0000 

PF 

0.773071 

0.097319 

7.943676 

0.0000 

LF 

-3797368. 

613773.1 

-6.186924 

0.0000 

DUM2 

601733.2 

100895.7 

5.963913 

0.0000 

DUM3 

1337180. 

186171.0 

7.182538 

0.0000 

DUM4 

1777592 . 

213162.9 

8.339126 

0.0000 

DUM5 

1828252 . 

231229.7 

7.906651 

0.0000 

DUM6 

1706474. 

228300.9 

7.474672 

0.0000 


F-squared 

0.971642 

Mean dependent var. 

1122524. 

Adjusted R -squared 

0.968841 

S.D. dependent var. 

1192075. 

S.E. of regression 

210422.8 

F-statistics 

346.9188 

Sum squared resid. 

3.59E+12 

Prob. (F-statistic) 

0.000000 

Log likelihood 

-1226.082 

Durbin-Watson stat. 

0.693288 


Nota: os valores restrito e irrestrito de R 2 sao obtidos das Tabelas 16.1 e 16.2. Observe ainda que 
o numero de restr^oes e 5 (por que?). 

A hipotese nula aqui e que todos os interceptos diferenciais sao iguais a zero. O valor calculado 
de Fpara os 5 graus de liberdade no numerador e 81 no denominador e altamente significativo, em 
termos estatisticos. Rejeitamos a hipotese nula de que todos os interceptos (diferenciais) sao zero. Se 
o valor F nao for estatisticamente significativo, poderiamos concluir que nao ha diferen?a nos inter¬ 
ceptos das seis empresas. Nesse caso, teriamos agrupado todas as 90 observances, como fizemos na 
regressao para dados empilhados na Tabela 16.2. 

O modelo (16.4.1) e conhecido como efeitos fixos unidirecionais (one-way), porque permitimos 
que os interceptos difiram entre as empresas. Mas tambem podemos permitir o efeito do tempo se 
acreditarmos que a iuncao de custo muda com o tempo devido a fatores como mudancas tecnologi- 
cas, mudancas nas regulamentagoes do governo e/ou polfticas tributarias, e outros efeitos. Tal efeito 
do tempo pode ser considerado facilmente se introduzirmos as variaveis dummies de tempo, uma para 
cada ano de 1970 ate 1984. Como temos dados para 15 anos, podemos introduzir 14 variaveis dummies 
(por que?) e estender o modelo (16.4.1) adicionando essas variaveis. Se fizermos isso, o modelo re- 
sultante sera chamado de modelo de efeitos fixos bidirecionais (two-way), porque permitimos os 
efeitos tanto do indivfduo quanto do tempo. 

Neste exemplo, se adicionarmos as dummies de tempo, teremos ao todo 23 coeficientes para esti- 
mar — o intercepto comum, cinco variaveis dummies das empresas aereas, 14 variaveis dummies de 
tempo e tres coeficientes angulares. Como podemos ver, consumiremos varios graus de liberdade. 
Alem disso, se decidirmos pemiitir que os coeficientes angulares difiram entre as empresas, podemos 
fazer as cinco variaveis das empresas aereas interagirem com cada uma das tres variaveis explanato- 
rias e introduzir os coeficientes dummies de inclinacao diferenciais. Teremos de estimar 15 coefi¬ 
cientes adicionais (cinco variaveis dummies interagiram com tres variaveis explanatorias). Como se 
isso nao bastasse, se fizermos as 14 variaveis dummies de tempo interagirem com as tres variaveis 
explanatorias, teremos no total 42 coeficientes adicionais para estimar. Como podemos ver, nao tere¬ 
mos qualquer grau de liberdade. 

Uma advertencia quanto ao uso do modelo de efeitos fixos 

Como sugere a discussao anterior, o modelo MQVD apresenta varios problemas que precisam ser 
lembrados. Primeiro, se introduzirmos variaveis dummies demais, teremos um problema de falta de 
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graus de liberdade. Ou seja, nao teremos observances suficientes para fazer uma analise estatistica 
significativa. Em segundo lugar, com diversas variaveis dummies no modelo, tanto individuals quan¬ 
to interativas ou multiplicativas, ha sempre a possibilidade de multicolinearidade, o que poderia difi- 
cultar a estimapao exata de um ou mais parametros. 

Em terceiro lugar, em algumas situapoes o modelo MQVD pode nao ser capaz de identificar o 
impacto das variaveis que nao mudam ao longo do tempo. Suponha que desejemos estimar uma fun- 
pao de salario para um grupo de trabalhadores usando dados em painel. Alem do salario, uma fun nao 
de salario pode incluir idade, experiencia e educapao como variaveis explanatorias. Suponha que 
tambem decidfssemos adicionar genero, cor e rapa como variaveis adicionais no modelo. Uma vez 
que essas variaveis nao mudarao com o tempo para um indivfduo, a abordagem das MQVD pode nao 
identificar o impacto dessas variaveis invariantes no tempo sobre os salarios. Em outros termos, os 
interceptos especificos a um sujeito absorvem toda a heterogeneidade que possa existir nas variaveis 
dependente e explanatoria. A proposito, as variaveis que nao variam no tempo as vezes sao chamadas 
de nuisance variable ou lurking variable. 

Quarto, temos de pensar cuidadosamente no termo de erro u it . Os resultados que apresentamos 
nas Equapoes (16.3.1) e (16.4.1) baseiam-se no pressuposto de que o termo de erro segue as hipoteses 
classicas, a saber, u h ~ MO, er). Uma vez que o fndice i refere-se a observances de corte tranversal e 
t a serie temporal, a hipotese classica para u it pode ter de ser modificada. Ha varias possibilidades, que 
incluem: 

1. Pressupomos que a variancia de erro e a mesma para todas as unidades de corte tranversal 
ou podemos considerar que a variancia de erro seja heterocedastica. * * * * 5 

2. Para cada indivfduo, podemos supor que nao haja autocorrelapao ao longo do tempo. Assim, 
em nosso exemplo ilustrativo, consideramos que o termo de erro da funpao de custo para a 
empresa 1 seja nao autocorrelacionado ou que ele seja autocorrelacionado, por exemplo, do 
tipo AR(1). 

3. Durante algum tempo, e possfvel que o termo de erro para a empresa 1 esteja correlacio- 
nado com o termo de erro, por exemplo, da empresa 2. 6 Ou podemos supor que nao haja 
correlapao. 

Ha ainda outras combinanbes e permutan'bes do termo de erro. Como voce percebera rapidamen- 
te, aceitar uma ou duas dessas possibilidades tornara a analise muito mais complicada. (Exigencias 
de espapo e de calculos matematicos impedem-nos de considerar todas as possibilidades. As referen- 
cias na nota de rodape 1 discutem alguns desses topicos.) No entanto, alguns desses problemas po- 
dem ser atenuados se considerarmos as alternativas discutidas nas duas senbes seguintes. 


16.5 O estimador de efeito fixo dentro do grupo 



Uma forma de estimarmos uma regressao para dados empilhados e eliminar o efeito fixo, /Si,-, 

expressando os valores das variaveis dependente e explanatoria para cada empresa como desvios de 

seus respectivos valores medios. Para a empresa 1 obteremos os valores medios amostrais de CT, Q, 
PF e LF {CT, Q, PF, e LF, respectivamente) e subtrafmos dos valores individuals dessas varia¬ 

veis. Os valores resultantes sao chamados corrigidos para a media. Fazemos isso para cada empresa 
e combinamos todos os (90) valores corrigidos para a media e efetuamos uma regressao de MQO. 


5 0 STATA fornece erros padrao corrigidos para heterocedasticidade nos modelos de regressao com dados em 
painel. 

6 Isso leva ao chamado modelo de regressao aparentemente nao relacionada, originalmente proposto por 
Arnold Zellner. Veja ZELLNER, A. "An efficient method of estimating seemingly unrelated regressions and tests 
for aggregation bias." journal of the American Statistical Association, 1962. v. 57, p. 348-368. 
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Se tCj,, q„, pf it e If), representam os valores corrigidos para a media, agora efetuamos a regres¬ 
sao: 


Ctu - qu + Pipft + P4ft + u it 


(16.5.1) 


em que i = 1, 2, ..., 6 e t = 1,2, ..., 15. Veja que a Equa§ao (16.5.1) nao tem um termo de intercepto. 
(Por que?) 

Retomando nosso exemplo, obtemos os resultados na Tabela 16.4. Not a: o prefixo DM significa 
que os valores sao corrigidos para a media ou expressos como desvios de suas medias de amostra. 

Observe a diferenna entre a regressao para dados empilhados da Tabela 16.2 e a regressao para 
dados empilhados da Tabela 16.4. A primeira apenas ignora a heterogeneidade entre as seis empresas, 
enquanto a ultima leva isso em conta, nao pelo metodo da variavel dummy, mas eliminando-o por 
diferencia 5 oes das observances amostrais em torno de suas medias amostrais. A difcrcnca entre os 
dois e obvia, como mostra a Figura 16.2. 


TABELA 16.4 


Dependent Variable: DMTC 
Method: Least Squares 
Sample: 1-90 

Included observations: 90 



Coefficient 

Std. Error 

t Statistic 

Prob. 

DMQ 

3319023 . 

165339.8 

20.07396 

0.0000 

DMPF 

0.773071 

0.093903 

8.232630 

0.0000 

DMLF 

-3797368 . 

592230.5 

-6.411976 

0.0000 


.R-squared 0.929366 Mean dependent var. 2.59E-11 
Adjusted R-squared 0.927743 S.D. dependent var. 755325.8 
S.E. of regression 203037.2 Durbin-Watson stat. 0.693287 
Sum squared resid. 3.59E+12 


FIGURA 16.2 

Estimador dentro do 
grupo. 


y* 



Fonte: Alan Duncan, “Cross-section and panel data econometrics”, notas nao publicadas de leitura (adaptadas). 
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Pode-se mostrar que o estimador DG produz estimativas consistentes dos coeficientes angulares, 
enquanto a regressao para dados empilhados ordinaria pode nao produzir. Deve-se acrescentar, no 
entanto, que os estimadores DG, embora consistentes, sao ineficientes (tem variancias maiores) com- 
paradas aos resultados de regressao com dados empilhados ordinarios. 7 Observe que os coeficientes 
angulares do Q, PF e LF sao identicos nas Tabelas 16.3 e 16.4. Isso ocorre, porque matematicamente 
os dois modelos sao identicos. Por sinal, os coeficientes de regressao estimados pelo metodo DG sao 
cliamados de estimadores DG. 

Uma desvantagem do estimador DG pode ser explicada com o seguinte modelo de regressao 
de salarios: 

W it - P\i + ftExperiencia,, + /f 3 Idade„ + /^Genero;? + /IsEscolaridade,, + fi 6 Raqa it 

(16.5.2) 

Nesta fun 5 ao de salario, as variaveis como genero, escolaridade e ra§a sao invariantes no tempo. 
Se usamos os estimadores DG, essas variaveis no tempo serao eliminadas (por causa da diferencia- 
5 ao). Como resultado, nao saberemos como o salario reage a essas variaveis que nao mudam ao 
longo do tempo. 8 Mas esse e o pre£o que temos de pagar para evitar a correla£ao entre o termo de erro 
(a, inclufdo em v,-,) e as variaveis explanatorias. 

Outra desvantagem do estimador DG e que: “[. . .] ele pode distorcer os valores de parametro e, 
certamente, eliminar qualquer efeito a longo prazo”. 9 Em geral, quando diferenciamos uma variavel, 
removemos o componente daquela variavel a longo prazo. Ficamos com o valor da variavel a curto 
prazo. Trataremos disso mais a frente, quando discutirmos a econometria das series temporais. 

Ao usarmos MQVD obtivemos as estimativas diretas dos interceptos para cada empresa aerea. 
Como podemos obter as estimativas dos interceptos usando o metodo DG? Para o exemplo de empre- 
sas aereas, eles sao obtidos como: 

at = C, - fr-Q, - p 3 ~PFi - faLF (16.5.3) 

em que as barras sobre as variaveis denotam os valores medios amostrais das variaveis da /-esima 
empresa. 

Ou seja, obtemos o valor do intercepto da /-esima empresa aerea subtraindo do valor medio da 
variavel dependente os valores medios das variaveis explanatorias para aquela empresa vezes os coe¬ 
ficientes angulares estimados dos estimadores DG. Note que os coeficientes angulares estimados 
permanecem os mesmos para todas as empresas, como mostra a Tabela 16.4. Pode ser observado que 
o intercepto estimado na Equa£ao (16.5.3) e parecido com o intercepto que estimamos no modelo de 
regressao linear padrao, o que pode ser visto da Equac^ao (7.4.21). Deixamos para o leitor encontrar 
os interceptos das seis empresas da maneira apresenta e verificar que sao os mesmos que os valores 
de interceptos derivados na Tabela 16.3, salvo por erros de arredondamento. 

Podemos notar que o intercepto estimado para cada empresa representa as caracterfsticas indi- 
viduo-especlficas de cada empresa, mas nao seremos capazes de identificar essas caracteristicas 
individualmente. Assim, o intercepto aq para a empresa 1 representa a filosofia gerencial daquela 
empresa, a compos^ao de sua diretoria, a personalidade do CEO, o genero do CEO etc. Todas essas 
caracteristicas de heterogeneidade sao inclufdas no valor do intercepto. Como veremos, tais caracte¬ 
risticas podem ser inclufdas no modelo de efeitos aleatorios. 


7 A razao para isso e que, quando expressamos variaveis como desvios de seus valores medios, a variagao nesses 
valores corrigidos para a media sera muito menor que a variagao nos valores originais das variaveis. Nesse caso, 
a variafao no termo de erro u it pode ser relativamente grande, levando, assim, a erros padrao maiores dos coe¬ 
ficientes estimados. 

8 lsto tambem e valido para o modelo MQVD. 

9 ASTERIOU, Dimitrius; HALL, Stephen G. Applied econometrics: a modern approach. Nova York: Palgrave Macmillan, 
2007. p. 347. 
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Aproposito, notamos que uma alternativa ao estimador DG e o metodo de primeiras diferen^as. 
No metodo DG, expressamos cada variavel como um desvio do valor medio daquela variavel. No 
metodo de primeiras diferen£as, para cada sujeito, tomamos diferengas sucessivas das variaveis. 
Assim, para a empresa 1, subtralmos a primeira observa§ao de CT da segunda observa§ao de CT, a 
segunda observaqao de CT da terceira observa£ao de CT e assim por diante. Fazemos isso para cada 
uma das variaveis remanescentes e repetimos o processo para as cinco empresas aereas remanescen- 
tes. Depois temos apenas 14 observances para cada empresa, uma vez que a primeira nao tem valor 
anterior. Como resultado, agora temos 84 observances em vez das 90 originais. Fazemos a regressao 
dos valores de primeira diferenga da variavel CT contra os valores de primeira diferenga das variaveis 
explanatorias, como se segue: 

A CTu = ft A Qn + PjAPFu + /I 4 A LFj, + ( u it — u it - 1 ) 

i= 1,2,..., 6 (16.5.4) 

t = 1.2.84 

em que A CT n = CT„ — CT„ f _j. Como notado no Capftulo 11, A e chamado de operador de primeira 
diferen§a . 10 

Por sinal, observe que o termo de erro original agora e substituldo pela diferen£a entre os valores 
atuais e, anteriores do termo de erro. Se nao houver autocorrelanao do termo de erro original, o termo 
de erro transformado sera is, e, portanto, ele impoe os tipos de problemas de estimanao que discuti- 
mos no Capitulo 11. Contudo, se as variaveis explanatorias forem estritamente exogenas, o estima¬ 
dor de primeira diferenga sera nao tendencioso, dados os valores das variaveis explanatorias. Note 
tambem que o metodo de primeira di fere 111 ;a tem as mesmas desvantagens que o metodo DG, no 
sentido de que as variaveis explanatorias que permanecem fixas ao longo do tempo para um individuo 
sao eliminadas na transforma§ao das primeiras diferen£as. 

Pode ser destacado que os estimadores de primeiras diferenfas e de efeitos fixos sao os mesmos 
quando temos apenas dois perfodos de tempo, mas, se houver mais que dois perfodos, eles diferirao. 
As razoes sao bastante complexas e o leitor interessado podera consultar as references . 11 Deixamos 
para o leitor um exercicio de aplica?ao do metodo das primeiras diferengas a nosso exemplo de em¬ 
presas aereas e a comparaqao dos resultados com os outros estimadores de efeitos fixos. 


16.6 O modelo de efeitos aleatorios (MEA) 

Falando sobre a modelagem de efeitos fixos, Kmenta escreve : 12 

Uma questao obvia relacionada ao modelo de covariancia [isto e, MQVD] e determinar se a inclusao de 
variaveis dummies - e a consequente perda de graus de liberdade - e realmente necessaria. O raciocfnio 
subjacente ao modelo de covariancia e que, ao especificannos o modelo de regressao, deixamos de in- 
cluir variaveis explanatorias relevantes que nao se alteram ao longo do tempo (e possivelmente outras 
que mudam ao longo do tempo, mas que tem o mesmo valor para todas as unidades de corte transversal) 
e que a inclusao das variaveis dummies seja uma cobertura de nossa ignorancia. 

Se as variaveis dummies representam de fato a falta de conhecimento sobre o (verdadeiro) mode¬ 
lo, por que nao expressar isso por meio do termo de erro? E exatamente essa a abordagem sugerida 
pelos proponentes do chamado modelo de componentes dos erros (MCE) ou modelo de efeitos 
aleatorios (MEA), que agora ilustraremos com a fungao de custo para nossas empresas. 

A ideia basica e comenar com a Equanao (16.4.1): 


10 Note que a Equafao (16.5.3) nao tem termo de intercepto (por que?), mas podemos inclul-lo se houver uma 
variavel de tendencia no modelo original. 

11 Veja particularmente WOOLDRIDGE, Jeffrey M. Econometric analysis of cross section and panel data. Cambridge, 
Mass.: MIT Press, 2002. p. 279-283. 

12 KMENTA, Jan. Elements of econometrics. 2. ed. Nova York: Macmillan, 1986. p. 633. 
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CTu - 0n + PiOit + PiPFit + 0\LFn + un ( 16 . 6 . 1 ) 

Em vez de tratarmos 0 U como fixo, pressupomos que ele seja uma variavel aleatoria com valor 
medio de 0 \ (nenhum subscrito i aqui). O valor de intercepto para uma empresa pode ser expresso 
como 


Pu =Pi+ Bt ( 16 . 6 . 2 ) 

em que e, e um termo de erro com um valor medio nulo e variancia er 2 

O que estamos dizendo em essencia e que as seis empresas inclufdas em nossa amostra foram ti- 
radas de um universo muito maior de empresas e que elas tem um valor medio comum para o inter¬ 
cepto (= /Sj). As diferen 9 as individuals de cada empresa se refletem no termo de erro £,-. 

Substituindo a Equa^ao (16.6.2) na Equaqiao (16.6.1), obtemos: 

CT it =0\+ 02Qit + 0iPFu + 0aLF u + St + Hu ^ 

= 0] + 02 On + 0iPFa + 04LFn + Wit 

em que 

w it = s, + u it ( 16 . 6 . 4 ) 

O termo de erro composto w lt consiste em dois componentes: que e o componente de corte trans¬ 
versal ou especifico dos individuos, e u it , que e o elemento de erro combinado da serie temporal e 
corte transversal e as vezes chamado de termo idiossincratico, porque varia com o corte transversal 
(isto e, o indivfduo) e tambem com o tempo. O modelo de componentes dos erros (MCE) recebe esse 
nome, porque o termo de erro composto consiste em dois (ou mais) erros. 

As hipoteses habituais feitas pelo MCE sao que 

e t ~N(0,tr?) 

Uit~N( 0,0%) ( 16 . 6 . 5 ) 

E(SjUi,) = 0; E(siSj) =0 (i / j) 

E ( uiiuit ) EiutjUij) E(u it Uj S ) 0 (i j . ? s ) 

isto e, os componentes de erro individual nao estao correlacionados entre si, nem com as unidades de 
corte transversal e de serie temporal. Tambem e muito importante observer que w it nao esta correla- 
cionado com qualquer uma das variaveis explanatorias inclufdas no modelo. Uma vez que e ; e um 
componente de w jt , e impossivel que este esteja correlacionado com as variaveis explanatorias. Se for 
esse o caso, o MCE resultara em estimativa inconsistente dos coeficientes de regressao. Logo dis- 
cutiremos o teste de Hausman, que nos informara em dada aplica^ao se w„ esta correlacionado com 
as variaveis explanatorias, isto e, se MCE e o modelo adequado. 

Observe a diferenpa entre o modelo de efeitos fixos e o de componente dos erros. No primeiro, a 
unidade de corte transversal tem seu proprio valor (fixo) de intercepto em todos esses N valores para 
N unidades de corte transversal. Ja no modelo de componente dos erros, por outro lado, o intercepto 
(comum) representa o valor medio de todos os interceptos (de corte tranversal) e o componente de 
erro e, representa o desvio (aleatorio) do intercepto individual desse valor medio. Lembre-se, no en- 
tanto, de que e, nao e diretamente observavel; ele e o que se conhece como uma variavel nao obser- 
vavel ou latente. 

Como resultado dos pressupostos estabelecidos na Equa 5 ao (16.6.5), segue-se que 

E(w u ) = 0 ( 16 . 6 . 6 ) 


var(w, ( ) = of + ct „ 2 


( 16 . 6 . 7 ) 
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Agora, se a 2 = 0, nao ha diferenga entre os modelos (16.3.1) e (16.6.3) e podemos apenas com- 
binar todas as observagoes (de corte tranversal e de serie temporal) e efetuar a regressao para dados 
empilhados, como fizemos na Equagao (16.3.1). Isso acontece, porque nessa situagao ou nao ha efei- 
tos especificos a um sujeito ou todos eles foram considerados nas variaveis explanatorias. 

Como mostra a Equagao (16.6.7), o termo de erro e homocedastico. Contudo, podemos demons- 
trar que w it e w is (f # s) sao correlacionados; os termos de erro de uma unidade de corte transversal 
em dois pontos diferentes no tempo estao correlacionados. O coeficiente de correlagao, (w it , w is ), e 
dado por: 

2 

p = correlagao (w, ; , w is ) = s ; t / s (16.6.8) 

Atengao a dois aspectos especiais do coeficiente de correlagao anterior. Primeiro, para qualquer 
unidade de corte transversal, o valor da correlagao entre os termos de erro em dois perfodos diferentes 
de tempo permanece o mesmo, nao importa quanto os dois perfodos de tempo estao distantes, como 
esta claro da Equagao (16.6.8). Isso contrasta acentuadamente com o processo [AR(1)] discutido no 
Capftulo 12, em que constatamos que a correlagao entre perfodos diminui ao longo do tempo. Segun- 
do, a estrutura de correlagao da Equagao (16.6.8) permanece a mesma para todas as unidades de 
corte transversal; ela e identica para todos os indivfduos. 

Se nao levarmos essa estrutura de correlagao em conta e estimarmos a Equagao (16.6.3) por 
MQO, os estimadores resultantes serao ineficientes. O metodo mais adequado aqui e o dos mmimos 
quadrados generalizados (MQG). 

Nao discutiremos a matematica dos MQG neste contexto devido a sua complexidade. 13 Uma 
vez que a maioria dos programas estatfsticos modernos agora tem rotinas para estimar o modelo de 
componente dos erros (bem como o modelo de efeitos fixos), apresentaremos os resultados apenas 
para nosso exemplo ilustrativo. Mas antes, podemos estender facilmente a Equagao (16.4.2) para 
permitir que um componente de erro aleatorio leve em conta variagoes ao longo do tempo (veja o 
Exercicio 16.6). 

Os resultados da estimagao da fungao de custo de empresas aereas pelo modelo de componentes 
dos erros sao apresentados na Tabela 16.5. Note esses aspectos do MEA. O valor (medio) do inter¬ 
cept e 107429,3. Os valores (diferenciais) do intercept das seis entidades sao dados no final da re¬ 
gressao. A empresa numero 1, por exemplo, tem um valor de intercept que e 270615 unidades mais 
baixo que aquele valor do intercept comum de 107429,3; o valor real do intercept para essa em¬ 
presa e, entao -163185,7. Por outro lado, o valor do intercept da empresa numero 6 e 57383 unida¬ 
des mais alto que o valor comum do intercept; o valor real do intercepto para essa empresa aerea e 
(107429,3 + 57383), ou 164812,3. Os valores do intercepto para as outras empresas aereas podem ser 
derivados de modo semelhante. Entretanto, veja que, se voce acrescentar os valores (diferenciais) do 
intercepto de todas as seis empresas, a soma sera 0, como deveria ser (por que?). 

Se voce comparar os resultados do efeito fixo e as regressoes de efeito aleatorio, percebera que ha 
diferengas substanciais entre os dois. A questao importante agora e: que resultados sao confiaveis? 
Em outras palavras, qual deveria ser a escolha entre os dois modelos? Podemos aplicar o teste de 
Hausman para elucidar a questao. 

A hipotese nula subjacente ao teste de Hausman e que os estimadores do modelo de efeito fixo e 
do modelo de componentes dos erros nao diferem substancialmente. O teste estatfstico desenvolvido 
por Hausman tem uma distribuigao assintotica y 2 . Se a hipotese nula for rejeitada, a conclusao e que 
o MCE nao e adequado, porque os efeitos aleatorios provavelmente estao correlacionados com um ou 
mais regressores. Nesse caso, o modelo de efeitos fixos e preferivel aos de efeitos aleatorios/compo- 
nentes dos erros. Para nosso exemplo, os resultados do teste de Hausman sao semelhantes aos mos- 
trados na Tabela 16.6. 


IB 


Veja KMENTA, op. cit., p. 625-630. 
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TABELA 16.5 


Dependent Variable: CT 

Method: Panel EGLS (Cross-section random effects) 

Sample: 1-15 

Periods included: 15 

Cross-sections included: 6 

Total panel (balanced) observations: 90 

Swamy and Arora estimator of component variances 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c 

107429.3 

303966.2 

3.534251 

0.0007 

Q 

2288588. 

88172.77 

25.95572 

0.0000 

PF 

1.123591 

0.083298 

13.48877 

0.0000 

LF 

-3084994. 

584373.2 

-5.279151 

0.0000 



Effects Specification 




S 

.D. 

Rho 

Cross- 

-section random 

107411.2 

0.2067 

Idiosyncratic random 

210422.8 

0.7933 



Firm 

Effect 

1 

1.000000 

-270615.0 

2 

2.000000 

-87061.32 

3 

3.000000 

-21338.40 

4 

4.000000 

187142.9 

5 

5.000000 

134488.9 

6 

6.000000 

57383.00 


TABELA 16.6 


Correlated Random Effects—Hausman Test 

Equation: Untitled 

Test cross-section random effects 


Test Summary 


Chi-Sq. 

Statistic 

Chi-Sq. d.f. 

Prob. 

Cross-section 

random 

49.619687 

3 

0.0000 

Cross-section 

random effects test comparisons: 


Variable 

Fixed 

Random 

Var(Diff.) 

Prob. 

Q 

PF 

LF 

3319023.28 

0.773071 

3797367.59 

2288587.95 

1.123591 

-3084994.0 

21587779733 . 

0.002532 

35225469544. 

0.0000 

0.0000 

0.0001 


O teste de Hausman rejeita claramente a hipotese nula, pois o valor y 2 estimado para 3 graus de 
liberdade e altamente significativo; se a hipotese nula for verdadeira, a probabilidade de obter um 
valor de qui-quadrado de ate 49,62 ou maior seria praticamente zero. Como resultado, podemos re- 
jeitar o MCE e preferir o modelo de efeitos fixos. Por sinal, a ultima parte da tabela compara os coe- 
ficientes de efeito fixo e de efeito aleatorio de cada variavel e, como a ultima coluna mostra, no nosso 
exemplo as diferenpas sao estatisticamente significativas. 

Teste do multiplicador de Lagrange de Breusch e Pagan 14 

Alem do teste de Hausman, tambem podemos usar o teste de Breusch-Pagan (BP) para verifi- 
car a hipotese de que nao ha efeitos aleatorios, isto e, a 2 u na Equa£ao (16.6.7) e zero. Esse teste esta 


14 BREUSCH, T.; PAGAN, A. R. "The Lagrange multiplier test and its application to model specification in 
econometrics." Review of Economic Studies, 1980. v. 47, p. 239-253. 
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incluldo em programas de computador como o STATA. Sob a hipotese nula, o BP segue uma dis- 
tribui^ao de qui-quadrado com 1 grau de liberdade; ha apenas 1 grau de liberdade, porque estamos 
testando a hipotese unica de que a 2 u = 0. Nao apresentaremos a formula que fundamenta o teste, pois 
e bastante complicada. 

Retomando nosso exemplo das empresas aereas, uma aplica 9 ao do teste BP produz um qui-quadrado 
de 0,61. Com 1 grau de liberdade, o p valor de obter um valor de qui-quadrado de 0,61 ou maior e 
cerca de 43%. Portanto, nao rejeitamos a hipotese nula. Em outras palavras, o modelo de efeitos alea¬ 
torios nao e adequado neste exemplo. O teste BP reforga o teste de Hausman, que tambem constatou 
que o modelo de efeitos aleatorios nao e adequado para nosso exemplo de empresas aereas. 

16.7 Propriedades de varios estimadores 15 

Discutimos varios metodos de estima 9 ao de modelos de regressao em painel (linear), como esti- 
madores para dados agrupados, estimadores de efeitos fixos que incluem estimadores de minimos 
quadrados com variavel dummy de mmimos quadrados (linear), estimadores dentro de grupos, esti¬ 
madores de primeiras diferen 9 as e estimadores de efeitos aleatorios. Quais suas propriedades estatfs- 
ticas? Uma vez que os dados em painel em geral envolvem um grande numero de observa 9 oes, nos 
concentraremos na propriedade da consistencia desses estimadores. 

Estimadores para dados empilhados 

Supondo que os coeficientes angulares sejam constantes entre os individuos, se o termo de erro na 
Equa 9 ao (16.3.1) nao estiver correlacionado com os regressores, os estimadores para dados empilha¬ 
dos serao consistentes. Entretanto, como observado, os termos de erro provavelmente estao correla- 
cionados ao longo do tempo para um dado individuo. Portanto, os erros padrao corrigidos para 
painel devem ser usados para testar a hipotese. Verifique se o programa estatistico que voce usa tem 
esse recurso; caso contrario os erros padrao calculados podem estar subestimados. Deve-se notar que, 
se o modelo de efeitos fixos for adequado, mas usarmos o estimador para dados empilhados, os coe¬ 
ficientes estimados serao inconsistentes. 

Estimadores de efeitos fixos 

Mesmo que se pressuponha que o modelo subjacente seja com dados empilhados ou de efeito 
aleatorio, os estimadores de efeitos fixos sao sempre consistentes. 

Estimadores de efeito aleatorio 

O modelo de efeitos aleatorios e consistente mesmo que o verdadeiro modelo seja o estimador 
para dados empilhados. No entanto, se o verdadeiro modelo for de efeitos fixos, o estimador de efei¬ 
tos aleatorios sera inconsistente. 

Para demonstra 9 oes e maiores detalhes sobre essas propriedades, consulte os livros-textos de 
Cameron e Trivedi, Greene e Wooldridge citados nas notas de rodape. 


16.8 Modelo de efeitos fixos versus modelo de efeitos aleatorios: 
algumas orientaloes 

O desafio que um pesquisador enfrenta e: qual modelo e melhor, o de efeitos fixos (MEF) ou o 
modelo de componente dos erros (MCE)? A resposta a essa pergunta depende do pressuposto que 
fazemos sobre a correla 9 ao provavel entre o componente de erro s, especifico ao corte transversal ou 
individual e os regressores X. 


15 A discussao a seguir e extrafda de CAMERON A. Colin; TRIVEDI, Pravin K. Microeconometrics: methods and 
applications. Nova York: Cambridge University Press, Cambridge, 2005. cap. 21. 
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Se considerarmos que e, e os X nao estao correlacionados, o modelo de componente dos erros 
pode ser adequado; mas, se e, e os X estiverem correlacionados, o modelo de efeitos fixos pode ser 
adequado. 

A hipotese subjacente ao modelo de componente dos erros e que os £, sao extrafoes aleatorias de 
uma populapao muito maior, mas as vezes este pode nao ser o caso. Por exemplo, suponha que dese- 
jemos estudar a taxa de criminalidade em 50 Estados dos Estados Unidos. Naturalmente, nesse caso, 
a hipotese de que os 50 Estados sao uma amostra aleatoria nao se sustenta. 

Tendo em mente essas duas abordagens, o que mais podemos verificar na escolha entre o modelo 
de efeitos fixos e o de componente dos erros? As observapoes de Judge et al. feitas a esse respeito 
podem ser uteis: 16 

1. Se T (o numero de dados da series temporais) for grande e N (o numero de unidades de cor- 
te transversal) for pequeno, provavelmente havera uma difercnca pequena nos valores dos 
parametros estimados pelo modelo de efeitos fixos e o de componente de erros. Logo, a es¬ 
colha aqui se baseia na conveniencia computacional. Nesse aspecto, o modelo de efeitos fi¬ 
xos pode ser preferivel. 

2. Quando jVe grande eTe pequeno (um painel curto), as estimativas obtidas pelos dois meto- 
dos podem diferir significativamente. Lembre-se de que, no MCE, fi u = fi\ + s h em que £,■ 
e o componente aleatorio de corte transversal, enquanto no modelo de efeitos fixos tratamos 
Pu como fixo e nao aleatorio. Nesse ultimo caso, a inferencia estatistica e condicional as 
unidades de corte transversal observadas na amostra. Isso e adequado se acreditarmos real- 
mente que as unidades individuals ou de corte transversal da amostra nao sao extrapoes 
aleatorias de uma amostra maior. Nesse caso, o modelo de efeitos fixos e adequado. Porem, 
se as unidades de corte transversal na amostra forem consideradas extrapbes aleatorias, o 
modelo de componente dos erros sera adequado, pois nesse caso a inferencia estatistica e 
incondicional. 

3. Se o componente dos erros individual e, e um ou mais regressores sao correlacionados, os 
estimadores de componente dos erros sao tendenciosos, enquanto aqueles obtidos do mode¬ 
lo de efeitos fixos sao nao tendenciosos. 

4. Se N for grande e T pequeno, e se as premissas subjacentes ao modelo de componente dos 
erros, os estimadores do modelo de componente dos erros sao mais eficientes que o modelo 
de efeitos fixos. 

5. Ao contrario do modelo de efeitos fixos, o modelo de componente dos erros pode esti- 
mar coeficientes das variaveis que nao mudam ao longo do tempo, como genero e ra 9 a. 
O modelo de efeitos fixos controla variaveis que nao mudam ao longo do tempo, mas 
nao pode estima-las diretamente, como esta claro dos modelos MQVD ou modelos de 
estimador dentro do grupo. Por outro lado, o modelo de efeitos fixos controla todas as 
variaveis que nao mudam ao longo do tempo (por que?), enquanto o modelo de compo¬ 
nente dos erros pode estimar apenas essas variaveis que nao mudam ao longo do tempo 
da forma como sao introduzidas explicitamente no modelo. 

Apesar do teste de Hausman, e importante ter em mente a advertencia feita por Johnston e Di- 
Nardo. Ao decidirem entre os modelos de efeitos fixos e de efeitos aleatorios, eles alegam que “ [...] 
nao existe uma regra simples para ajudar o pesquisador a ir alem da Scylla de efeitos fixos e o 
Charybdis de erro de med^ao e sele 9 ao dinamica. Embora sejam um aprimoramento em rela 9 ao aos 
dados de corte transversal, os dados em painel nao oferecem a cura para os problemas do 
econometrista”. 17 


16 JUDGE et al., op. cit., p. 489-491. 

17 JOHNSTON, Jack; DINARDO, John. Econometric methods. 4. ed. Nova York: McGraw-Hill, 1997. p. 403. 
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16.9 Regressao de dados em painel: alguns comentarios conclusivos 

Como observado no inicio, a modelagem de dados em painel e um assunto vasto e complexo; mal 
arranhamos a superficie. Entre os varios topicos que nao discutimos, estao: 

1. O teste de hipoteses com dados em painel. 

2. A heterocedasticidade e a autoccrrelagao no modelo de componente dos erros. 

3. Dados em painel desbalanceados. 

4. Modelos dinamicos de dados em painel em que os valores defasados do regressando apare- 
cem como uma variavel explanatoria. 

5. Equagdes simultaneas envolvendo dados em painel. 

6 . Variaveis dependentes qualitativas e dados em painel. 

7. Raizes unitarias em dados em painel (sobre raizes unitarias, veja o Capftulo 21). 

Um ou mais desses topicos podem ser encontrados nas referencias citadas neste capftulo, e o leitor 
e convidado a consulta-los para aprender mais sobre o assunto. Essas referencias tambem citam va¬ 
rios estudos aplicados em diversas areas economicas e de negocio que tem usado modelos de regres¬ 
sao com dados em painel. O iniciante e aconselhado a ler algumas dessas aplicagoes para ter uma 
ideia de como os pesquisadores tem implementado tais modelos. 18 


16.10 Alguns exemplos ilustrativos 


EXEMPLO 16.1 

Produtividade e 

investimento 

publico 


Para descobrir por que a produtividade caiu e qual e o papel do investimento publico, 
Alicia Munnell estudou dados sobre produtividade em 48 Estados continentais norte-ame- 
ricanos durante 17 anos, de 1970 a 1986, para um total de 816 observagoes. 19 Usando 
esses dados, estimamos a regressao para dados empilhados na Tabela 16.7. Note que essa 
regressao nao leva em conta a natureza dos dados em painel. 


TABELA 16.7 


Dependent Variable: LGSP 
Method: Panel Least Squares 


Sample: 1970-1986 

Periods included: 17 

Cross-sections included: 48 

Total panel (balanced) observations: 816 


Coefficient Std. Error t Statistic Prob. 


c 

LPRIVCAP 

LPUBCAP 

LWATER 

LUNEMP 

0.907604 

0.376011 

0.351478 

0.312959 

-0.069886 

0.091328 

0.027753 

0.016162 

0.018739 

0.015092 

9.937854 

13.54847 

21.74758 

16.70062 

-4.630528 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

R -squared 


0.981624 

Mean 

dependent var. 

10.50885 

Adjusted F- 

squared 

0.981533 

S.D. 

dependent var. 

1.021132 

S.E. of regression 

0.138765 

F-statistic. 

10830.51 

Sum squared 

resid. 

15.61630 

Prob. 

. (F-statistic) 

0.000000 

Log likelihood 

456.2346 

Durbin-Watson stat. 

0.063016 


( Continua ) 


18 Para maiores detalhes e aplicagoes concretas, veja ALLISON, Paul D. Fixed effects regression methods for longitudinal 
data, using 545. Carolina do Norte: SAS Institute, Cary, 2005. 

19 Os dados de Munnell estao disponfveis em: www.aw-bc.com/murray. 
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EXEMPLO 16.1 

( Continuagao ) 


TABELA 16.8 


TABELA 16.9 


A variavel dependente nesse modelo e o GSP (produto bruto estadual), e as variaveis ex- 
planatorias sao: PRIVCAP (capital privado), PUBCAP (capital publico), WATER (fornecimento 
de agua), e UNEMP (taxa de desemprego). Nota: L representa logaritmo natural. 

Todas as variaveis tern o sinal esperado e todas sao individual e coletivamente significati- 
vas, do ponto de vista estatistico, supondo-se gue todas as hipoteses do modelo classico de 
regressao linear sejam mantidas. 

Para levarmos em conta a dimensao do painel, na Tabela 16.8 estimamos um modelo de 
efeitos fixos usando 47 variaveis dummies para os 48 Estados, para evitar cair na armadilha da 
variavel dummy. 


Dependent Variable: LGSP 

Method: Panel Least Squares 

Sample: 1970-1986 

Periods included: 17 

Cross-sections included: 48 

Total panel (balanced) observations: 816 



Coefficient 

Std. Error 

t Statistic 

Prob. 

c 

-0.033235 

0.208648 

-0.159286 

0.8735 

LPRIVCAP 

0.267096 

0.037015 

7.215864 

0.0000 

LPUBCAP 

0.714094 

0.026520 

26.92636 

0.0000 

LWATER 

0.088272 

0.021581 

4.090291 

0.0000 

LUNEMP 

-0.138854 

0.007851 

-17.68611 

0.0000 



Effects 

Specification 


Cross-section fixed 

(dummy variables) 


.R-squared 

0.997634 

Mean dependent var. 

10.50885 

Adjusted R-squared 

0.997476 

S.D. dependent var. 

1.021132 

S.E. of regression 

0.051303 

F-statistic 

6315.897 

Sum squared resid. 

2.010854 

Prob. (F-statistic) 

0.000000 

Log likelihood 

1292.535 

Durbin-Watson stat. 

0.520682 


Dependent Variable: LGSP 

Method: Panel EGLS (Cross-section random effects) 

Sample: 1970-1986 

Periods included: 17 

Cross-sections included: 48 

Total panel (balanced) observations: 816 

Swamy and Arora estimator of component variances 



Coefficient 

Std. Error t 

Statistic 

Prob. 

C 

-0.046176 

0.161637 

-0.285680 

0.7752 

LPRIVCAP 

0.313980 

0.029740 

10.55760 

0.0000 

LPUBCAP 

0.641926 

0.023330 

27.51514 

0.0000 

LWATER 

0.130768 

0.020281 

6.447875 

0.0000 

LUNEMP 

-0.139820 

0.007442 

-18.78669 

0.0000 

Effects Specification 



S.D. 


Rho 

Cross-section random 

0.130128 


0.8655 

Idiosyncratic random 

0.051303 


0.1345 


Para pouparmos espago, apresentaremos apenas os coeficientes de regressao estimados e 
nao os coeficientes de cada variavel dummy. Mas deve-se acrescentar que as variaveis 
dummies dos 47 Estados eram significativas do ponto de vista estatistico. 


( Continua ) 
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EXEMPLO 16.1 

(' Continuagao ) 


Podemos ver que ha diferengas substanciais entre a regressao para dados empilhados e a de 
efeitos fixos, que questionam os resultados da regressao para dados empilhados. Para verificar- 
mos se o modelo de efeitos aleatorios e mais adequado nesse caso, apresentamos os resultados 
do modelo de regressao de efeitos aleatorios na Tabela 16.9. Para escolhermos entre os dois 
modelos, usamos o teste de Hausman, que apresenta os resultados da Tabela 16.10. 

Uma vez que o valor estimado do qui-quadrado e altamente significativo do ponto de 
vista estatfstico, rejeitamos a hipotese de que nao ha diferenga significativa nos coeficientes 
estimados dos dois modelos. Parece haver correla^ao entre o termo de erro e um ou mais 
regressores. Logo, podemos rejeitar o modelo de efeitos aleatorios em favor do modelo de 
efeitos fixos. No entanto, como a ultima parte da Tabela 16.10 mostra, nem todos os coefi¬ 
cientes diferem nos dois modelos. Por exemplo, nao ha uma diferenfa estatisticamente 
significativa nos valores do coeficiente de LUNEMP nos dois modelos. 


TABELA 16.10 


Test Summary 

Chi-Sq. 

Statistic 

Chi-Sq. d.f. 

Prob. 

Cross-section random 

42.458353 

4 

0.0000 

Cross-section random effects test comparisons: 

Variable Fixed Random Var (Diff.) 

Prob. 

LPRIVCAP 

0.267096 

0.313980 

0.000486 

0.0334 

LPUBCAP 

0.714094 

0.641926 

0.000159 

0.0000 

LWATER 

0.088272 

0.130768 

0.000054 

0.0000 

LUNEMP 

-0.138854 

-0.139820 

0.000006 

0.6993 


EXEMPLO 16.2 

Demanda por 
energia eletrica 
nos EUA 


TABELA 16.11 


Em seu artigo, Maddala et al. consideraram a demanda de energia eletrica e gas natural 
em residences em 49 Estados norte-americanos para o perfodo de 1970-1990; o Havaf nao 
foi inclufdo na analise. 20 Neste exemplo, so iremos considerar a demanda por eletricidade 
residencial. Primeiro apresentamos os resultados com base na estima^ao de efeitos fixos 
(Tabela 16.11) e entao na estima^ao de efeitos aleatorios (Tabela 1 6.12), seguida por uma 
comparagao dos dois modelos. 


Dependent Variable: Log(ESRCBPC) 

Method: Panel Least Squares 

Sample: 1971-1990 

Periods included: 20 

Cross-sections included: 49 

Total panel (balanced) observations: 980 



Coefficient 

Std. Error 

t Statistic 

Prob. 

C 

-12.55760 

0.363436 

-34.55249 

0.0000 

Log(RESRCD) 

-0.628967 

0.029089 

-21.62236 

0.0000 

Log(YDPC) 

1.062439 

0.040280 

26.37663 

0.0000 

Effects Specification 

Cross-section 

fixed (dummy 

variables) 




F-squared 

0.757600 

Mean dependent var. 

-4.536187 

Adjusted i?-squared 

0.744553 

S.D. dependent var. 

0.316205 

S.E. of regression 

0.159816 

Akaike info criterion 

-0.778954 

Sum squared resid. 

23.72762 

Schwarz criterion 

-0.524602 

Log likelihood 

432.6876 

Hannan-Quinn criter. 

-0.682188 

F-statistic 

58.07007 

Durbin-Watson stat. 

0.404314 

Prob. (F-statistic) 

0.000000 




( Continua ) 


20 MADDALA, G. S.; TROST, Robert P.; LI, Hongyi; JOUTZ, Frederick. "Estimation of short-run and long-run elasticities 
of demand from panel data using shrikdage estimators." journal of Business and Economic Statistics, jan. 1997. 
v. 15, n. 1, p. 90-100. 
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EXEMPLO 16.2 

( Continuagao ) 


TABELA 16.12 


em que Log (ESRCBPC) = logaritmo natural do consumo de eletricidade residencial per capita 
(em bilhoes), Log(RESRCD) = logaritmo natural do pre^o real de eletricidade de 1987 e 
Log(YDPC) = logaritmo natural da renda real per capita disponfvel para 1987. 

Uma vez que este e um modelo de log duplo, os coeficientes angulares estimados repre- 
sentam elasticidades. Mantendo-se os demais fatores constantes, se a renda real per capita 
subir 1%, o consumo medio de eletricidade subira cerca de 1%. Da mesma forma, manten- 
do-se os demais fatores constantes, se o prego real da energia eletrica subir 1 %, o consumo 
medio de eletricidade caira cerca de 0,6%. Todas as elasticidades estimadas sao estatistica- 
mente significativas. 

Os resultados do modelo de erro aleatorio estao na Tabela 1 6.12. Parece que nao ha mui- 
ta diferen^a nos dois modelos. Mas podemos usar o teste de Hausman para descobrir se e 
este o caso. Os resultados desse teste sao semelhantes aos da Tabela 16.1 3. 

Embora os coeficientes dos dois modelos nas Tabelas 16.11 el 6.12 sejam bem parecidos, 
o teste de Hausman mostra que este nao e o caso. O valor do qui-quadrado e altamente 
significativo estatisticamente. Portanto, podemos escolher o modelo de efeitos fixos ao mo¬ 
delo de efeitos aleatorios. 


Dependent Variable: Log(ESRCBPC) 

Method: Panel EGLS (Cross-section random effects) 

Sample: 1971-1990 

Periods included: 20 

Cross-sections included: 49 

Total panel (balanced) observations: 980 

Swamy and Arora estimator of component variances 


Coefficient Std. Error t Statistic Prob. 


C -11.68536 0.353285 -33.07631 0.0000 

Log(RESRCD) -0.665570 0.028088 -23.69612 0.0000 

Log(YDPC) 0.980877 0.039257 24.98617 0.0000 


Effects Specification 




S.D. 

Rho 

Cross-section random 
Idiosyncratic random 


0.123560 

0.159816 

0.3741 

0.6259 


Weighted 

Statistics 


R-squared 

Adjusted R-squared 
S.E. of regression 
E-statistic 

Prob. (E-statistic) 

0.462591 

0.461491 

0.168096 

420.4906 

0.000000 

Mean dependent var. 
S.D. dependent var. 
Sum squared resid. 
Durbin-Watson stat. 

-1.260296 

0.229066 

27.60641 

0.345453 


Unweighted 

Statistics 


R-squared 

Sum squared resid. 

0.267681 

71.68384 

Mean dependent var. 
Durbin-Watson stat. 

-4.536187 

0.133039 


( Continua ) 
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EXEMPLO 16.2 

(' Continuagao ) 


Test Summary 


Chi-Sq. 

Statistic 

Chi-Sq. d.f. 

Prob. 

Cross-section 

random 

105.865216 

2 

0.0000 

Cross-section 

random effects test comparisons: 


Variable 

Fixed 

Random 

Var (Diff.) 

Prob. 

Log(RESRCD) 

Log(YDPC) 

-0.628967 

1.062439 

-0.665570 

0.980877 

0.000057 

0.000081 

0.0000 

0.0000 


TABELA 16.13 

Correlated Random Effects—Hausman Test 
Equation: Untitled 

Test cross-section random effects 


Este exemplo ressalta o ponto importante de que, quando o tamanho da amostra e grande, 
em nosso caso 980 observagoes, mesmo pequenas diferengas nos coeficientes estimados dos dois 
modelos podem ser estatisticamente significativas. Os coeficientes da variavel Log(RESRCD) nos 
dois modelos parecem razoavelmente proximos, mas estatisticamente nao sao. 


EXEMPLO 16.3 

Consumo de 
cen’eja, renda e 
imposto sobre a 
cen’eja 


Para avaliar o impacto do imposto sobre a cerveja no consumo de cerveja, Philip Cook 
investigou a relagao entre os dois, depois de admitir o efeito-renda. 21 seus dados sao relativos 
a 50 estados e a Washington, D.C, para o perfodo de 1975-2000. neste exemplo, estudare- 
mos a rela^ao de vendas de cerveja per capita e renda, tudo no nfvel estadual. Apresenta- 
remos os resultados dos modelos de MQO para dados empilhados, de efeitos fixos e de 
efeitos aleatorios em forma tabular na tabela 1 6.14. A variavel dependente sao as vendas de 
cerveja per capita. 

Esses resultados sao interessantes. em se tratando de uma teoria economica, esperarfamos 
uma relagao negativa entre o consumo de cerveja e os impostos sobre a bebida, que e o caso 
para os tres modelos. o efeito-renda negativo sobre o consumo de cerveja sugeriria que a 
cerveja e um bem inferior, ou seja, aquele em que a demanda diminui quando a renda dos 
consumidores aumenta. 

Para nossos propositos, e interessante notar a diferen^a nos coeficientes estimados. Apa- 
rentemente nao ha muita diferen^a nos coeficientes estimados entre o modelo de efeitos 
fixos e o modelo de componentes dos erros. De fato, o teste de hausman produz um valor 
de qui-quadrado de 3,4, que nao e significativo para 2 graus de liberdade a um nfvel de 
5%; o p valor e 0,1 783. 

Os resultados baseados no MQO, no entanto, sao completamente diferentes. o coeficien- 
te da variavel imposto sobre cerveja, em valor absoluto, e muito menor que o obtido do 
modelo de efeitos fixos ou do modelo de componentes dos erros. A variavel renda, embora 
tenha sinal negativo, nao e estatisticamente significativa, enquanto os outros dois modelos 
mostram que ela e altamente significativa. 

Este exemplo mostra claramente o que poderia acontecer se negligenciassemos a estru- 
tura em painel dos dados e estimassemos uma regressao para dados empilhados. 

( Continua ) 


21 Os dados usados aqui sao obtidos do site de MURPHY, Michael P. Econometrics: a modern introduction. Boston: 
Pearson/Addison Wesley, 2006. Os dados originals foram coletados por Philip Cook para seu livro, Paying the 
tab: the costs and benefits of alcohol control. Princeton, Nova Jersey: Princeton University Press, 2007. 
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EXEMPLO 16.3 TABELA 16.14 


( Continuagao) 

Variavel 

MQO 

MEF 

MEA 


Constante 

1,4192 

1,7617 

1,7542 


Imposto sobre a cerveja 

(24,37) 

-0,0067 

(52,23) 

-0,0183 

(39,22) 

-0,0181 


Renda 

(-2,13) 

-3,54(e-6) 

(-9,67) 

-0,000020 

(-9,69) 

-0,000019 


R 1 2 3 4 5 6 

(-1,12) 

0,0062 

(-9,17) 

0,0052 

(-9,10) 

0,0052 


Notas: Os dados entre parenteses sao razoes t estimadas. —3,54(e—6) = —0,00000354. 


Resumo e 
conclusoes 


1. Os modelos de regressao em painel baseiam-se em dados em painel. Estes consistem em 
observa 5 oes sobre as mesmas unidades de corte transversal, ou individuals, em varios perfo- 
dos de tempo. 

2. Varias sao as vantagens de usar dados em painel. Primeiro, eles aumentam consideravel- 
mente o tamanho da amostra. Em segundo lugar, ao estudarmos observances repetidas de 
corte transversal, os dados em painel sao mais adequados para estudar a dinamica da mu- 
dan 9 a. Terceiro, os dados em painel permitem estudar modelos comportamentais mais 
complicados. 

3. Apesar de suas vantagens substanciais, os dados em painel impoem varios problemas de 
estimanao e inferencia. Uma vez que esses dados envolvem tanto dimensoes temporais 
quanto de corte transversal, os problemas inerentes aos dados de corte transversal (por exem- 
plo, heterocedasticidade) e de series temporais (por exemplo, autocorrelacjao) precisam ser 
tratados. Ha tambem alguns problemas adicionais, como de correla§ao cruzada de unidades 
individual no mesmo ponto no tempo. 

4. Ha varias tecnicas de estima^ao para tratar de um ou mais desses problemas. As duas mais 
destacadas sao (1) o modelo de efeitos fixos (MEF) e (2) o modelo de efeitos aleatorios 
(MEA), ou modelo de componentes dos erros (MCE). 

5. No MEF, o intercepto do modelo de regressao pode diferir entre indivfduos, em reconhe- 
cimento ao fato de que cada indivfduo, ou unidade de corte transversal, pode ter caracte- 
rfsticas especiais proprias. Para levarmos em conta os diferentes interceptos, podemos 
usar variaveis dummies. O modelo de efeitos fixos que usa variaveis dummies e conhecido 
como modelo de minimos quadrados com variaveis dummies para efeitos fixos (MQVD). 
O FEM e adequado em situanoes em que o intercepto especifico ao individuo pode estar 
correlacionado com um ou mais regressores. Uma desvantagem do MQVD e que ele con- 
some muitos graus de liberdade quando o numero de unidades de corte transversal, N, e 
muito grande, e nesse caso temos de introduzir N variaveis dummies (mas suprimir o ter- 
mo de intercepto comum). 

6 . Uma alternativa ao MEF e o modelo de componentes dos erros (MCE). Nele supoe-se que o 
intercepto de uma unidade individual seja extraido aleatoriamente de uma populacjao muito 
maior com um valor medio constante. O intercepto individual e, entao, expresso como um 
desvio desse valor medio constante. Uma vantagem do MCE sobre o MEF e que ele e eco- 
nomico nos graus de liberdade, e nao temos de estimar N interceptos de corte transversal. So 
precisamos estimar o valor medio do intercepto e sua variancia. O MCE e adequado em si- 
tua 5 oes em que cada unidade do intercepto (aleatorio) do corte transversal nao esta correla- 
cionada com os regressores. Outra vantagem do MCE e que podemos introduzir variaveis 
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como genera, religiao e raga, que permanecem constantes para um dado indivfduo. No MEF 
nao podemos fazer isso, porque todas essas variaveis sao colineares com o intercepto espe- 
cifico ao individuo. Alem disso, se usamos o estimador dentro do grupo ou o estimador de 
primeiras diferengas, toda a invariancia no tempo desaparecera. 

7. O teste de Hausman pode ser usado para decidir entre o MEF e o MCE. Tambem podemos 
usar o teste de Breusch-Pagan para verificar se o MCE e adequado. 

8 . Apesar de sua crescente utilizagao em pesquisa aplicada, e apesar da crescente disponibili- 
dade de tais dados, as regressoes de dados em painel podem nao ser adequadas em todas as 
situagoes. E preciso usar o julgamneto pratico em cada caso. 

9. Ha problemas especificos com os dados em painel que precisam ser considerados. O 
mais serio e o do atrito, pelo qual, por uma razao ou por outra, os indivfduos do painel 
desaparecem ao longo do tempo e nos levantamentos subsequentes (ou cortes transver- 
sais) permanecem menos indivfduos no painel. Mesmo que nao haja atrito, ao longo do 
tempo os indivfduos podem nao querer, ou mesmo se recusarem, a responder a algumas 
perguntas. 


EXERCICIOS 16.1. Quais os aspectos especiais de (a) dados de corte transversal, (b) dados de series temporais e 
(c) dados em painel? 

16.2. O que se entende por modelo de efeitos fixos (MEF)? Uma vez que os dados em painel tem 
dimensoes temporais e espaciais, como o modelo de efeitos fixos permite ambas as dimen¬ 
soes? 

16.3. O que se entende por modelo de componentes dos erros (MCE)? Como ele difere do modelo 
dos efeitos fixos? Quando o modelo de componentes dos erros e adequado? E quando o mode¬ 
lo de efeitos fixos e adequado? 

16.4. Ha diferenga entre o modelo de mfnimos quadrados com variaveis dummies, o estimador de 
dentro de um grupo e modelos de primeiras diferengas? 

16.5. Quando os modelos de regressao de dados em painel sao inadequados? De exemplos. 

16.6. Como voce estenderia o modelo (16.4.2) para ter um componente de erro temporal? Anote o 
modelo. 

16.7. Consulte os dados sobre produgao de ovos e seus pregos, apresentados na Tabela 1.1. Qual 
modelo pode ser adequado aqui, o de efeitos fixos (MEF) ou o de componentes dos erros 
(MCE) ? Por que? 

16.8. Para os investimentos apresentados na Tabela 1.2, qual modelo voce escolheria - o de efeitos 
fixos ou o de efeitos aleatorios? Por que? 

16.9. Com base no Michigan Income Dynamics Study, Hausman tentou estimar um modelo de sala- 
rios, ou ganhos, usando uma amostra de 629 formandos no segundo grau, que foi seguida por 
um perfodo de seis anos, dando assim, no total, 3.774 observagoes. A variavel dependente 
nesse estudo foi o logaritmo do salario, e as variaveis explanatorias foram: idade (dividida em 
varias faixas etarias); desemprego no ano anterior; problemas de saude no ano anterior; traba- 
lho como autonomo; regiao de residencia (para formandos no Sul, Sul = 1 e 0 em caso contra- 
rio) e area de residencia (para um formando da area rural. Rural = 1 e 0 nos demais casos). 
Hausman usou tanto o modelo de efeitos fixos quanto o de componentes dos erros. Os resulta- 
dos estao na Tabela 16.15 (erros padrao entre parenteses). 
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TABELA 16.15 

Equagoes de salarios 
(variavel dependente: 
logaritmo de salarios) 

Fonte: reproduzido de 
HSIAO, Cheng. Analysis of 
panel data. Cambridge 
University Press, 1986, p. 
42. Fonte original: 
HAUSMAN, J. A. 
“Specification tests in 
econometrics.”. 
Econometrica, vl. 46, p. 
1.251-1.271, 1978. 



Variavel 

Efeitos fixos 

Efeitos aleatorios 

1 . 

Idade 1 (20-35) 

0,0557 (0,0042) 

0,0393 (0,0033) 

2. 

Idade2 (35-45) 

0,0351 (0,0051) 

0,0092 (0,0036) 

3. 

Idade 3 (45-55) 

0,0209 (0,0055) 

-0,0007 (0,0042) 

4. 

Idade 4 (55-65) 

0,0209 (0,0078) 

-0,0097 (0,0060) 

5. 

Idade 5 (65- ) 

-0,0171 (0,0155) 

-0,0423 (0,0121) 

6. 

Desempregado no ano anterior 

-0,0042 (0,0153) 

-0,0277 (0,0151) 

7. 

Problemas de saude no ano anterior 

-0,0204 (0,0221) 

-0,0250 (0,0215) 

8. 

Trabalho como autonomo 

-0,2190 (0,0297) 

-0,2670 (0,0263) 

9. 

Sul 

-0,1569 (0,0656) 

-0,0324 (0,0333) 

10 . 

Rural 

-0,0101 (0,0317) 

-0,1215 (0,0237) 

11. 

Constante 

— 

0,8499 (0,0433) 


S 2 

0,0567 

0,0694 


Craus de liberdade 

3,135 

3,763 


a. Esses resultados econdmicos fazem sentido? 

b. Existe uma grande diferenga nos resultados produzidos pelos dois modelos? Em caso afir- 
mativo, o que poderia responder pelas difcrencas? 

c. Com base nos dados apresentados na tabela, que modelo, se houver, voce escolheria? 

Exercfcios aplicados 

16.10. Consulte o exemplo da empresa aerea discutido no texto. Em vez do modelo linear da Equa- 
gao (16.4.2), estime um modelo de regressao log-linear e compare seus resultados com os da 
Tabela 16.2. 

16.11. Consulte os dados da Tabela 1.1. 

a. Seja Y = ovos produzidos (em milhoes) e X = prego dos ovos (centavos por duzia). Estime 
o modelo para os anos de 1990 e 1991 separadamente. 

b. Agrupe as observagoes para os dois anos e estime a regressao para dados empilhados. Que 
pressupostos voce esta fazendo ao agrupar os dados? 

c. Use o modelo de efeitos fixos, distinguindo os dois anos e apresente resultados de regressao. 

d. Voce pode usar o modelo de efeitos fixos, distinguindo os 50 Estados? Por que? 

e. Faria sentido distinguir tanto o efeito Estado quanto o efeito ano? Nesse caso, quantas va- 
riaveis dummies voce teria de introduzir? 

f. O modelo de componentes de erro seria adequado para modelar a produgao de ovos? Por 
que? Veja se voce consegue estimar esse modelo usando, por exemplo, o EViews. 

16.12. Continue com o Exercicio 16.11. Antes de efetuar a regressao para dados empilhados, voce 

quer descobrir se os dados podem ser empilhados. Para tanto, use o teste de Chow discutido no 

Capftulo 8. Mostre os calculos necessarios envolvidos e determine se a regressao para dados 

empilhados faz sentido. 

16.13. Use os dados de investimento apresentados na Tabela 1.6. 

a. Estime a fungao de investimento de Grunfeld para cada empresa. 

b. Agora agrupe os dados para todas as empresas e estime a fungao de investimento de Grunfeld 
pelos MQO. 

c. Use o MQVD para estimar a fungao investimento e compare seus resultados com a regres¬ 
sao para dados empilhados estimada em ( b ). 
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TABELA16.16 

Taxa de desemprego e 
remunerafao por hora 
em manufatura, nos 
Estados Unidos, 
Canada e Reino 
Unido, 1980-2006 

Fonte: Economic Report of 
the President, janeiro 2008, 
Tabela B-109. 


d. Como voce decidiria entre a regressao para dados empilhados e o MQVD? Mostre os cal- 
culos necessarios. 

16.14. A Tabela 16.16 apresenta dados sobre a taxa de remunera 5 ao por hora no setor de manufatura em 
dolares americanos Y (%), e a taxa de desemprego civil, X (rndice, 1992 = 100), para o Canada, o 
Reino Unido e os Estados Unidos para o periodo de 1980-2006. Considere o modelo: 

Yu = P\ + PiX it + u it (1) 


Ano 

REM_EUA 

DES_EUA 

REM_CAN 

DES_CAN 

REM_RU 

RU_RU 

1980 

55,9 

7,1 

49,0 

7,3 

47,1 

6,9 

1981 

61,6 

7,6 

53,8 

7,3 

47,5 

9,7 

1982 

67,2 

9,7 

60,1 

10,7 

45,1 

10,8 

1983 

69,3 

9,6 

64,3 

11,6 

41,9 

11,5 

1984 

71,6 

7,5 

65,0 

10,9 

39,8 

11,8 

1985 

75,3 

7,2 

65,0 

10,2 

42,3 

11,4 

1986 

78,8 

7,0 

64,9 

9,3 

52,0 

11,4 

1987 

81,3 

6,2 

69,6 

8,4 

64,5 

10,5 

1988 

84,1 

5,5 

78,5 

7,4 

74,8 

8,6 

1989 

86,6 

5,3 

85,5 

7,1 

73,5 

7,3 



5,6 





1990 

90,5 


92,4 

7,7 

89,6 

7,1 

1991 

95,6 

6,8 

100,7 

9,8 

99,9 

8,9 

1992 

100,0 

7,5 

100,0 

10,6 

100,0 

10,0 

1993 

102,0 

6,9 

94,8 

10,8 

88,8 

10,4 



6,1 





1994 

105,3 


92,1 

9,6 

92,8 

8,7 

1995 

107,3 

5,6 

93,9 

8,6 

97,3 

8,7 

1996 

109,3 

5,4 

95,9 

8,8 

96,0 

8,1 

1997 

112,2 

4,9 

96,7 

8,4 

104,1 

7,0 

1998 

118,7 

4,5 

94,9 

7,7 

113,8 

6,3 

1999 

123,4 

4,2 

96,8 

7,0 

117,5 

6,0 

2000 

134,7 

4,0 

100,0 

6,1 

114,8 

5,5 

2001 

137,8 

4,7 

98,9 

6,5 

114,7 

5,1 

2002 

147,8 

5,8 

101,0 

7,0 

126,8 

5,2 

2003 

158,2 

6,0 

116,7 

6,9 

145,2 

5,0 

2004 

161,5 

5,5 

127,1 

6,4 

171,4 

4,8 

2005 

168,3 

5,1 

141,8 

6,0 

177,4 

4,8 

2006 

172,4 

4,6 

155,5 

5,5 

192,3 

5,5 


Notas: DES = Taxa de desemprego %. REM = Indice de remunera^o por hora em dolares americanos, 1992-100. 
CAN = Canada, RU = Reino Unido 


a. A priori , qual a re lagan esperada entre Y e XI Por que? 

b. Estime o modelo da Equagao (1) para cada pals. 

c. Estime o modelo, agrupando todas as 81 observagoes. 

d. Estime o modelo de efeitos fixos. 

e. Estime o modelo de componentes dos erros. 

f. Qual o melhor modelo, o MEF ou o MCE? Justifique sua resposta ( Dica: aplique o teste de 
Hausman). 

16.15. Baltagi e Griffin consideraram a seguinte fungao de demanda por gasolina: 


In Y it — Pi + Pi In Xm + Pi In X^t + Pa In X^t + u it 


* BALTAGI, B. H.; GRIFFIN, J. M. "Gasoline demand in the OECD: an application of pooling and testing procedures." 
European Economic Review, v. 22, p. 117-137, 1983. Os dados para 18 pafses da OECD para os anos 
1960-1978 estao disponfveis em: http://www.wiley.com/legacy/wileychi/baltagi/supp/Gasoline.dat ou no site 
do livro, Tabela 16.1 7. 
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em que Y = consumo de gasolina por carro; X 2 = renda real per capita ; X 2 = preco real da 
gasolina; X 4 = numero de carros per capita ; i = codigo do pais, em todos os 18 pafses inte- 
grantes da OECD (Organizayao para a Cooperanao e Desenvolvimento Economico); e t = 
(observances anuais de 1960-1978). Not a: os valores na tabela ja estao em logaritmo. 

a. Estime a funnao de demanda agrupando os dados para todos os 18 pafses (um total de 342 
observances). 

b. Estime um modelo de efeitos fixos usando os mesmos dados. 

c. Estime um modelo de componentes aleatorios usando os mesmos dados. 

d. De sua analise, qual modelo descreve melhor a demanda de gasolina nos 18 pafses da 
OECD? Justifique sua resposta. 

16.16. O artigo de Subhayu Bandyopadhyay e Howard J. Wall, (“The determinants of aid in the 
post-cold war era”, Review, Federal Reserve Bank of St. Louis, v. 89, n. 6, p. 533-547, nov./ 
dez. 2007) usa dados em painel para estimar a resposta da ajuda recipiente a necessidades 
economicas e fisicas dos paises, direitos civis/politicos e efetividade do governo. Os dados 
referem-se a 135 pafses, para um perfodo de tres anos. O artigo e os dados estao disponfveis 
em: <http://research.stlouisfed.org/publications/review/past/2007>, v. 89, n. 10, nov./dez. Os 
dados podem ser encontrados ainda na Tabela 16.18 do site do livro. Estime o modelo dos 
autores (dado na pagina 534 para o artigo deles) usando um estimador de efeitos aleatorios. 
Compare seus resultados com aqueles dos estimadores de efeitos fixos e para dados empilha- 
dos pelos autores na Tabela 2 do artigo deles. Qual modelo e adequado aqui, o de efeitos fixos 
ou o de efeitos aleatorios? Por que? 

16.17. Consulte o exemplo de empresas aereas discutido no texto. Para cada empresa aerea, estime 
uma fungao de custo com serie logarftmica. Como essas regressoes comparam-se com os mo¬ 
delos de efeitos fixos e aleatorios discutidos no capitulo? Voce estimaria tambem as 15 funfoes 
logarftmicas de custo de corte transversal? Por que? 


Capitulo 

Modelos econometricos 
dinamicos: modelos 
autorregressivos e com 
defasagens distribuidas 

Na analise de regressao envolvendo dados de series temporais, se o modelo de regressao incluir 
nao so os valores correntes mas tambem os defasados (passados) das variaveis explanatorias (os X), 
sera chamado de modelo de defasagens distribuidas. Se o modelo incluir um ou mais valores defa¬ 
sados da variavel dependente entre suas variaveis explanatorias, sera denominado modelo autorre- 
gressivo. Assim, 

Y, - a + faX t + P\X t -1 + fcXt -2 + u t 



representa um modelo de defasagens distribuidas, enquanto 

Yt = ot + fXt + y Y {-1 + lit 

e exemplo de um modelo autorregressivo. Este tambem e chamado de modelo dinamico, por retratar 
a trajetoria da variavel dependente no tempo, em rela 5 ao a seus valores passados. 

Os modelos autorregressivo e de defasagens distribuidas sao usados extensamente na analise 
econometrica e serao examinados neste capitulo com a finalidade de esclarecer o seguinte: 

1. Qual e o papel das defasagens na economia? 

2. Quais as razoes para defasagens? 

3. Existe justificativa teorica para os modelos defasados usados comumente em econometria empirica? 

4. Qual e a relaijao, se houver, entre o modelo de defasagem autorregressivo e o de defasagens dis¬ 
tribuidas? Um pode derivar do outro? 

5. Cite alguns problemas estatisticos envolvidos na estima 5 ao desses modelos. 

6. A rela 5 ao lead-lag entre variaveis implica causalidade? Nesse caso, como a medimos? 

17.1 O papel do “tempo” ou “defasagem”, em economia 

Em economia, a dependencia de uma variavel Y (a variavel dependente) sobre outras variaveis X 
(a variavel explanatoria) raramente e imediata. Com muita frequencia, Y responde a X com lapsos de 
tempo. Esse lapso e chamado de defasagem. Para ilustrar a natureza das defasagens, consideremos 
varios exemplos. 


614 
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EXEMPLO 17.1 

Afungao 

consumo 


Suponhamos que uma pessoa receba um aumento de salario de $2 mil no pagamento 
anual e que este seja um aumento "permanente", ou seja, sera mantido. Qual o efeito des- 
se aumento na renda sobre as despesas de consumo anual da pessoa? 

Depois de um aumento na renda, as pessoas em geral nao se apressam em gasta-lo imedia- 
tamente. Assim, aquele que recebeu pode decidir aumentar as despesas de consumo em $ 800 
no primeiro ano apos o aumento de salario na renda e mais $ 600 no proximo ano e outros 
$ 400 no ano seguinte, economizando o restante. No final do terceiro ano, as despesas de con¬ 
sumo anual terao aumentado $ 1.800. Podemos, assim, escrever a fungao consumo como 


Y t = constante + 0,4X t + 0,3X t _i + 0,2X t -2 + u t ( 17 . 1 . 1 ) 

em que Ye a despesa de consumo e X, a renda. 

A Equag:ao (1 7.1.1) mostra que o efeito de um aumento na renda de $ 2 mil e distribuf- 
do por um perfodo de 3 anos. Modelos como a Equagao (1 7.1.1) sao, portanto, chamados 
de modelos de defasagens distribuidas, porque o efeito de uma dada causa (renda) espalha-se 
por varios perfodos. Geometricamente, o modelo de defasagens distribuidas (1 7.1.1) esta 
na Figura 1 7.1 ou, alternativamente na Figura 1 7.2. 


FIGURA 17.1 

Exemplo de 

defasagens 

distribuidas. 



FIGURA 17.2 

Efeito de uma 
alterafao unitaria 
em X no perfodo 
t sobre Y no 
perfodo t e 
subsequentes. 


Efeito sobre Y PqX, f^X, p 2 X, P 3 X, P 4 X, 



Em termos gerais, podemos escrever 

Y t = a + / 3 oX t + P\X t -\ + @2X1-2 -i-F fikXt-k + u t (17.1.2) 

que e um modelo de defasagens distribuidas com um numero de defasagens k finito no tempo. O coefi- 
ciente ft {) e conhecido como multiplicador de curto prazo ou de impacto, porque da a varia5ao do 
valor medio de Y em decorrencia da varia5ao unitaria de X no mesmo perfodo . 1 Se a varia5ao em X for 


1 Tecnicamente, f! 0 e a derivada parcial de Y com relagao a X t , ft ea derivada parcial com relagao a X t _ 3 , fS 2 com 
relafao a X t _ 2 e assim por diante. Simbolicamente, dY t /dX t - k = p k . 
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mantida no mesmo nrvel a partir daf, (A) + ft ft da a variagao no (valor medio) Y no periodo seguinte, 
(A) + fti + ftft) no periodo subsequente e assim por diante. Essas somas parciais sao chamadas de 

multiplicadores interinos ou intermediaries. Depois de k perfodos, obtemos 

k 

J^fti = Po+Pi+P2+■■■+ Pk= ft (17.1.3) 

1=0 

conhecido como multiplicador de defasagens de longo prazo ou total, desde que exista a 
soma ft (a ser discutida adiante). 

Se definimos 

_ Pi _ Pi 

Pi jftp. p (17.1.4) 

obtemos o A padronizado. Somas parciais do A padronizado dao a proporcao do impacto a longo 
prazo, ou total, sentido por um certo periodo de tempo. 

Voltando a regressao do consumo (17.1.1), vemos que o multiplicador de curto prazo, que nada 
mais e do que a propensao marginal a consumir (PMC), e 0,4, enquanto o multiplicador de longo 
prazo, que e a propensao marginal a consumir a longo prazo, e 0,4 + 0,3 + 0,2 = 0,9. Ou seja, apos 
um aumento de $ 1 na renda, o consumidor aumentara seu nfvel de consumo em cerca de $ 0,40 no 
ano do aumento, em mais $0,30 no ano seguinte e outros $0,20 no ano subsequente. O impacto de 

um aumento de $ 1 na renda a longo prazo e, portanto, de $0,90. Se dividimos cada A P°r 0,9, obte¬ 

mos, respectivamente, 0,44, 0,33 e 0,23, que indicam que 44% do impacto total de uma variagao uni- 
taria de X sobre Y e sentido imediatamente, 77% depois de um ano e 100% no final do segundo ano. 


EXEMPLO 17.2 

Criagao de 
moeda pelos 
bancos 
{demanda por 
depositos) 


Suponha que o Banco Central injete $1 mil de moeda nova no sistema bancario com- 
prando tftulos do governo. Qual sera a quantia total de moeda bancaria ou demanda por 
depositos que sera gerada? 

Seguindo o sistema de reservas fracionarias, se supusermos que por lei os bancos devem 
manter uma reserva de 20% para garantir os depositos gerados, entao, pelo conhecido pro- 
cesso multiplicador, a quantia total de depositos em dinheiro a ser gerada sera igual a 
$ 1,000[1 /(I — 0,8)] = $ 5.000. Evidentemente, $ 5 mil em depositos em dinheiro nao serao 
criados do dia para a noite. O processo leva tempo, o que pode ser mostrado esquematica- 
mente na Figura 1 7.3. 


FIGURA 17.3 

Expansao 
cumulativa em 
depositos 
bancarios (reserva 
inicial de $ 1 mil e 
requisito de 20 % 
de reserva). 
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EXEMPLO 17.3 

Relagao entre 
nioeda e pregos 


De acordo com os monetaristas, a inflagao e essencialmente um fenomeno monetario 
no sentido que um aumento contfnuo no nfvel geral de pregos deve-se a taxa de expan- 
sao da oferta de moeda em excesso em relagao a quantidade de moeda realmente de- 
mandada pelas unidades economicas. Evidentemente, essa ligagao entre inflagao e 
mudangas na oferta de moeda nao e imediata. Estudos mostraram que a defasagem entre 
as duas e em torno de 3 a aproximadamente 20 trimestres. Os resultados em determina- 
do estudo estao na Tabela 17.1, 2 na qual vemos que o efeito de uma variagao de 1% na 
oferta de moeda no conceito de M1B (D moeda manual, C demanda por depositos em 
instituigoes financeiras) e sentido no perfodo de 20 trimestres. O impacto a longo prazo 
de uma variagao de 1% na oferta de moeda sobre a inflagao e de aproximadamente 
1 (= £ m i)i que e estatisticamente significativo, enquanto o impacto a curto prazo e de 
aproximadamente 0,04, que nao e significativo, embora os multiplicadores intermedia¬ 
ries paregam significativo de modo geral. Vale mencionar que, uma vez que P e M sao 
dados em forma percentual, o m, (/J,- em nossa notagao usual) da a elasticidade de P com 
relagao a M, isto e, a resposta percentual de pregos a um aumento de 1% na oferta de 
moeda. Assim, m 0 = 0,041 significa que, para um aumento de 1% na oferta de moeda, a 
elasticidade-prego a curto prazo e de cerca de 0,04%. A elasticidade em longo prazo e de 
1,03%, implicando que em longo prazo um aumento de 1% na oferta de moeda reflete- 
se aproximadamente no mesmo aumento percentual nos pregos. A curto prazo, um au¬ 
mento de 1 % na oferta de moeda e acompanhado a longo prazo por um aumento de 1 % 
na taxa de inflagao. 


TABELA 17.1 

Estimativa da 

equagao 

moeda-pregos: 

especificagao 

original 

Fonte: Carlson, Keith M. 
“The lag from money to 
prices.” Review, Federal 
Reserve Bank of St. 
Louis, out. 1980, Tabela 
1, p. 4. 


Perfodo da amostra: 1955-1 to 1969—IV: m 2 ^ = 0 

20 

P =- 0,146+ Y m i i 

i= 0 

(0,395) 



Coef. 

\t\ 


Coef. 

Ifl 


Coef. 

Ifl 

m 0 

0,041 

1,276 

m s 

0,048 

3,249 

0116 

0,069 

3,943 

m i 

0,034 

1,538 

mg 

0,054 

3,783 

0117 

0,062 

3,712 

m 2 

0,030 

1,903 

Olio 

0,059 

4,305 

Oils 

0,053 

3,511 

m 3 

0,029 

2,171 

mn 

0,065 

4,673 

0119 

0,039 

3,338 

/r?4 

0,030 

2,235 

mi 2 

0,069 

4,795 

0120 

0,022 

3,191 

m 5 

0,033 

2,294 

mi 3 

0,072 

4,694 

£oi< 

1,031 

7,870 

m 6 

0,037 

2,475 

mi 4 

0,073 

4,468 

Defasagem 

10,959 

5,634 

m 7 

0,042 

2,798 

011 5 

0,072 

4,202 

media 



R 2 

0,525 ep 

i 1,066 

D.W. . 

2,00 






Notas: P = taxa de crescimento geometrico anual do deflator do PNB 
M = taxa de crescimento geometrico anual do M1B 


EXEMPLO 17.4 

Defasagem entre 
despesas com 
P&De 
produtividade 


A decisao de investir em pesquisa e desenvolvimento (P&D) e seu retorno em termos 
do aumento da produtividade envolve uma defasagem consideravel, na verdade varias 
defasagens, como, "... a defasagem entre o investimento de recursos e o tempo em que 
as invengoes comegam a aparecer, a defasagem entre o nascimento de uma ideia e seu 
desenvolvimento ate a etapa de aplicagao comercial e a defasagem, introduzida pelo pro- 
cesso de difusao: leva tempo ate que todas as maquinas antigas sejam substitufdas por 
maquinas melhores". 3 


2 CARLSON, Keith M. "The lag from money to prices". Review, Federal Reserve Bank of St. Louis, out. 1980, Tabe¬ 
la 1, p. 4. 

3 GRILICHES, Zvi. "Distributed lags: a survey". Econometrica, jan.1967. v. 36, n. 1, p. 16-49. 
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EXEMPLO 17.5 

A curva J da 

economia 

international 


Os estudantes de economia internacional conhecem o que e chamado de curva /, que 
mostra a relagao entre a balanga comercial e a deprecia^ao do cambio. Depois da deprecia- 
£ao da moeda de um pafs (por exemplo, devido a desvalorizagao), inicialmente a balan^a 
comercial deteriora-se, para mais adiante melhorar, mantido tudo o mais constante. A curva 
e apresentada na Figura 1 7.4. 


FIGURA 17.4 

A curva J. 

Fonte: Krugman, Paul 
R.; Obstfeld, Maurice. 
International 
economics: theory and 
practice. 3. ed. Harper 
Collins, Nova York: 
Harper Collins, 1994. 
p. 465. 


Conta corrente 

(em unidades de produgao nacional) 


Efeito de longo prazo 
da depreciagao real 
em conta corrente 



e inicia-se a curva J curva J 


EXEMPLO 17.6 

0 modelo do 
acelerador do 
investimento 


Em sua forma mais simples, o princfpio de aceleragao da teoria de investimento diz que o 
investimento e proporcional a mudan^as no produto. Simbolicamente, 

l t =P(X t — X t _i) P > 0 (17.1.5) 

em que l t e o investimento no perfodo t, X t e a produgao no perfodo t, e X t _i e o produto no 
periodo (t — 1). 


Os exemplos anteriores sao apenas uma amostra do uso de defasagens em economia. Sem duvida, 
o leitor podera extrair varios exemplos de sua propria experiencia. 


17.2 A razao das defasagens 4 

Embora os exemplos citados na Se£ao 17.1 apontem para a natureza de fenomenos defasados, 
eles nao explicam plenamente por que as defasagens ocorrem. Ha tres razoes principals: 

1. Razoes psicologicas. Como resultado da for£a do habito (inercia), as pessoas nao mudam seus habi- 
tos de consumo imediatamente apos uma redu 5 ao no pre 50 ou um aumento na renda, talvez porque 
de imediato o processo de mudan 5 a possa envolver uma desutilidade imediata. Por isso, aqueles 
que ficam milionarios de repente ao ganhar na loteria podem nao mudar os estilos de vida aos quais 
estao acostumados ha muito tempo, porque nao sabem como reagir imediatamente a um ganho ines- 
perado. Evidentemente, depois de um tempo razoavel, podem aprender a viver com sua fortuna 
recem-adquirida. Alem disso, muitas vezes as pessoas nao sabem se a mudan 5 a e “permanente” ou 
“transitoria”. Assim, a rea 5 ao a um aumento em minha renda dependera de ele ser ou nao perma¬ 
nente. Se for apenas um ganho adicional e nos perfodos subsequentes minha renda voltar ao rnvel 
anterior, poderei economizar todo o aumento, enquanto outra pessoa em minha posipao podera de- 
cidir “torra-lo”. 


4 Esta sefao baseia-se em NERLOVE, Marc. Distributed lags and demand analysis for agricultural and other commodities. 
Agricultural Handbook, n. 141, U.S. Department of Agriculture, jun. 1958. 
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2. Razees tecnologicas. Suponha que o prego de capital relativo a mao de obra tenha uma queda, 
tornando economicamente viavel a substituigao do capital por trabalho. Evidentemente, aumentar 
o capital leva tempo (o perfodo de gestagao). Alem disso, se esperamos que a queda no prego seja 
temporaria, as empresas podem nao se apressar para substituir capital por mao de obra, principal- 
mente se esperam que depois de uma queda temporaria nos pregos de capital este possa ter um 
aumento que va alem de seu nfvel anterior. As vezes, o conhecimento imperfeito tambem res- 
ponde pelas defasagens. Atualmente o mercado de computadores pessoais esta ligado a todos os 
tipos de computadores com pregos e especificagoes variados. Alem disso, desde a sua introdugao 
no final da decada de 1970, os pregos da maioria deles tem caido acentuadamente. Como resul- 
tado, os consumidores potenciais podem hesitar em comprar ate que tenham tido tempo para exami- 
nar as especificagoes e pregos de todas as marcas concorrentes. Eles podem hesitar em comprar, 
esperando que haja queda dos pregos ou inovagoes. 

3. Razees institucionais. Estas razoes tambem contribuem para defasagens. Por exemplo, as obriga- 
goes contratuais podem impedir as empresas de mudar de uma fonte de mao de obra ou materia- 
-prima para outra. Outro exemplo sao aqueles que substituiram fundos em contas-poupanga de 
longo prazo por fundos com prazo fixo com duragoes de um, dois, tres ou sete anos e estao es- 
sencialmente “presos”, embora as condigoes do mercado financeiro possam ser tais que rendi- 
mentos mais altos estejam disponfveis em outra parte. Da mesma forma, os empregadores dao 
frequentemente a seus funcionarios opgao entre varios pianos de saude, mas, uma vez feita a es- 
colha, o funcionario nao pode mais mudar para outro piano durante o prazo irunimo de um ano. 
Embora isso possa ser feito por conveniencia administrativa, o funcionario estara impedido de 
mudar durante um ano. 

Pelas razoes que acabamos de discutir, a defasagem ocupa um papel central na economia. Isso se 
reflete claramente na metodologia de curto prazo/longo prazo da economia. E por essa razao que di- 
zemos que a elasticidade-renda ou a elasticidade-prego a curto prazo em geral sao menores (em valo- 
res absolutos) que as elasticidades correspondentes a longo prazo ou que a propensao marginal ao 
consumo a curto prazo e menor que aquela a longo prazo. 


17.3 Estima^ao de modelos com 



distribmdas 


Considerando que os modelos com defasagens distribmdas possuam um importante papel em 
economia, como estima-los? Especificamente, suponha que tenhamos o seguinte modelo de defasa¬ 
gens distribmdas em uma variavel explanatoria: 5 


Y, - a + p 0 X t + P\X t _ i + PiXt-i + • • • + lit 


(17.3.1) 


em que nao definimos a duragao da defasagem, ou seja, quanto recuamos no passado. Este e o chama- 
do modelo de defasagens infinito, enquanto na Equagao (17.1.2) temos o modelo finito de defasa¬ 
gens distribmdas pelo fato de o numero de defasagens, k, ser especificado. Continuaremos a usar a 
Equagao (17.3.1), porque e facil de calcular matematicamente, como veremos. 6 

Como estimamos a e o ft da Equagao (17.3.1)? Podemos adotar duas abordagens: (1) a estimativa 
ad hoc e (2) restrigoes a priori do ft supondo que os ft sigam um padrao sistematico. Consideraremos 
a estimagao ad hoc nesta segao e a outra abordagem na Segao 17.4. 

Estimagao ad hoc dos modelos de defasagens distribmdas 

Ja que se supoe que a variavel explanatoria X, seja nao estocastica (ou pelo menos nao correlacio- 
nada com o termo de erro u,), X t _ h X,_ 2 e assim por diante tambem sao nao estocasticas. Em princl- 
pio, os mlnimos quadrados ordinarios podem ser aplicados a Equagao (17.3.1). Esta e a abordagem 

5 Se houver mais de uma variavel explanatoria no modelo, cada variavel pode ter um efeito defasado sobre Y. 
Apenas por simplicidade, supomos apenas uma variavel explanatoria. 

6 Na pratica, entretanto, os coeficientes dos valores de X mais distantes tem um efeito desprezfvel sobre Y. 
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seguida por Alt 7 e Tinbergen 8 . Eles sugerem que para estimar a Equagao (17.3.1) podemos proceder 
sequencialmente; ou seja, primeiro fazendo a regressao de Y, contra X,, depois a regressao de Y, con¬ 
tra X, e X t _i, em seguida a regressao de Y, contra X t , X t _, e X,_ 2 e assim sucessivamente. O procedi- 
mento sequencial e descontinuado quando os coeficientes de regressao das variaveis defasadas 
comegam a tornar-se estatisticamente insignificantes e/ou o coeficiente de pelo menos uma das varia¬ 
veis muda o sinal de positivo para negativo ou vice-versa. De acordo com esse preceito, Alt fez a 
regressao de consumo de combustfvel de Y sobre novos pedidos, X. Com base nos dados trimestrais 
para o periodo de 1930-1939, os resultados foram os seguintes: 

Y, = 8,37+ 0,17 IX, 

Y, = 8,27+ 0,11 IX, + 0,064X,_! 

Y t = 8,27+ 0.109X, + 0,071X,_! - 0,055X,_ 2 

Y, = 8,32+ 0.108X, + 0,063X,_i + 0,022X f _ 2 - 0,020X ,_ 3 

Alt escolheu a segunda regressao como a “melhor”, pois nas duas ultimas equagoes o sinal do X,_ 2 
nao estava estavel e na ultima o sinal de X,_ 2 foi negativo, o que pode ser diffcil de interpretar em 
termos economicos. 

Embora aparentemente simples, a estimagao ad hoc apresenta varias desvantagens, como as 
seguintes: 

1. Nao existe, a priori, uma orientagao sobre a qual sera a duragao maxima da defasagem . 9 

2. Ao estimarem-se defasagens sucessivas, restam menos graus de liberdade, tomando a inferencia es- 
tatfstica mais incerta. Economistas em geral nao contam com longas series de dados que lhes permi- 
tam estimar inumeras defasagens. 

3. Mais importante, nas series temporais economicas, os valores sucessivos (defasagens) tendem a 
estar altamente correlacionados, com o que o fantasma da multicolinearidade faz sua aparigao. 
Como mencionado no Capftulo 10, a multicolinearidade conduz a estimativas pouco precisas, isto 
e, os erros-padrao tendem a ser grandes em relagao aos coeficientes estimados. Em consequencia, 
com base nas razoes t estimadas, podem indicar (equivocadamente) que um coeficiente defasado 
e estatisticamente insignificante. 

4. A busca sequencial pela duragao da defasagem leva o pesquisador a recorrer ao processo de data 
mining. Tambem, como notamos na Segao 13.4, o verdadeiro nivel de significancia para testar hipo- 
teses estatfsticas toma-se uma questao importante em buscas sequenciais (veja a Equagao (13.4.2)). 

Em vista dos problemas apresentados, o procedimento de estimagao ad hoc seria pouco recomen- 
davel. Claramente, algumas consideragoes a priori ou teoricas devem ser tratadas para conhecermos 
melhor os varios fi e sermos capazes de abordar o problema de estimagao de um modo mais eficiente. 


17.4 A abordagem de Koyck dos modelos 



distribmdas 


Koyck propos um metodo engenhoso de estimar os modelos com defasagens distribuidas. Supo- 
nha que comegamos com um modelo de defasagens distribuidas no infinito (17.3.1). Atribuindo o 
mesmo sinal aos f>, Koyck supoe que eles declinam geometricamente, como segue: 10 


h = 


(17.4.1) 11 


k= 0, 1,... 


7 ALT, F. F. "Distributed lags". Econometrica, v. 10, p. 11 3-128, 1942. 

8 TINBERGEN, J. "Long-term foreign trade elasticities". Metroeconomica, v. 1, p. 1 74-185, 1949. 

9 Se a duragao da defasagem k estiver especificada incorretamente, nos depararemos com o problema de erros 
de especificagao discutido no Capftulo 13. Lembre-se tambem da advertencia sobre o data mining. 

10 KOYCK, L. M. Distributed lags and investment analysis. Amsterda: North Holland Publishing Company, 1954. 

11 As vezes tambem escrito como 


p k = /3 0 (1 - X)/, k k= 0,1,... 
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em que X, tal que 0 < X < 1,6 conhecido como a taxa de declmio, ou queda, das defasagens distribuf- 
das e em que 1 — X e a velocidade de ajustamento. 

O que a Equapao (17.4.1) postula e que cada coeficiente sucessivo dc ft e numericamente menor 
que o ft anterior (esta afirmapao se segue dc X < 1), o que implica que, quando se volta ao passado 
distante, o efeito dessa defasagem sobre Y, torna-se cada vez menor, um pressuposto bem plauslvel. 
Afinal, as rendas atuais e do passado recente afetam a atual despesa com consumo mais fortemente que 
a renda no passado distante. Geometricamente, o esquema de Koyck e apresentado na Figura 17.5. 

Como mostra a figura, o valor do coeficiente de defasagem ft k depende, alem do ft (l comum, do 
valor de X. Quanto mais proximo X estiver de 1, mais lenta sera a taxa de declmio no ft k , enquanto 
que, quanto mais proximo estiver de zero, mais rapido sera o declmio em ft k . No primeiro caso, os 
valores de X exercerao impacto consideravel em Y t , enquanto no ultimo caso sua influencia sobre Y, 
desaparecera rapidamente. Esse padrao pode ser visto claramente por meio da seguinte tabela: 


X 

Po 

Pi 

P 2 

Pi 

P 4 

Ps 

010 

0,75 

Po 

0,7 5 fto 

0,56ft 0 

0,42ft 0 

0,32ft 0 

0,24p 0 ■ ■ 

■ O,O60o 

0,25 

Po 

0,25/Jq 

0,06/Sq 

0,02fto 

0,004ft 0 

0,001 ft, 

• 0,0 


Observe os seguintes aspectos do esquema de Koyck: (1) ao pressupor valores nao negativos para 
X, Koyck descarta a mudanpa de sinal dos ft', (2) ao pressupor X < 1, prcssupoc que ele atribui menos 
peso para os ft distantes que aos atuais; e (3) assegura que a soma dos ft, que da o multiplicador de 
longo prazo, seja finita, ou seja, 

J2Pk= fto( T3t) (17.4.2) 12 

k= 0 V 1 7 


FIGURA 17.5 

O esquema de Koyck 
(distribui§ao 
geometrica 
declinante). 


A 



Por razoes dadas na nota de rodape 12. 

12 Isto acontece porque 

y= >3 0 (1 + A + X 2 + A 3 + • • ) = fto ^ 1 ^ 

Ja que a expressao entre parenteses do lado direito e uma serie geometrica infinita cujo somatorio e 1 /(I — A.), desde 
que 0 < A < 1. Vale notar que, se ft k for definido como na nota 11, ftoO ~ Q/0 - A) = fto, assegurando, 

assim, que a soma dos pesos (1 — A)A k seja 1. 
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Como resultado da Equapao (17.4.1), o modelo defasado infinito (17.3.1) pode ser escrito 
como 


Y t — a + PoX t + \ + PqX 2 X ,-2 + ' ■' + u t (17.4.3) 

Como esta, o modelo ainda nao se presta a uma estimapao facil, ja que resta estimar ainda um 
grande numero (literalmente infinito) de parametros e o parametro X entra de forma altamente nao 
linear: em termos estritos, o metodo de analise de regressao linear (nos parametros) nao pode ser 
aplicado a tal modelo. Mas Koyck sugere uma saida engenhosa. Ele defasa a Equapao (17.4.3) em um 
perfodo para obter 

Yt- i = « + PoX t -\ + PoXX t - 2 + Po^ 2 X t -3 + • ■ ■ + Ut -1 (17.4.4) 

Entao multiplica a Equapao (17.4.4) por X para obter 

XY t -1 = Xa + XfioX t -1 + PoX 2 X t -2 + PqX 2 X t - 2 + ■ ■ • + Xu t ~ i (17.4.5) 

Subtraindo a Equapao (17.4.5) da Equapao (17.4.3), obtem-se 

Y t - XY t - i = a(l - X) + p 0 X, + (u, - Xu,- X ) (17.4.6) 

ou, rearranjando, 

Y t = a{\ — X) + p 0 X t + XY t -1 + V( (17 4 7) 

em que v, = ( u, — Xu, — 1), e uma media movel de u, e u t -\. 

O procedimento que acabamos de descrever e conhecido como transformapao de Koyck. Com- 
parando a Equapao (17.4.7) com a Equapao (17.3.1), vemos a enorme simplificapao efetuada por 
Koyck. Enquanto antes tinhamos de estimar a e um numero infinito de P, agora temos de estimar 
apenas tres incognitas: a, Pq e X. Agora nao ha razao para esperar que ocorra multicolinearidade. Em 
certo sentido, a multicolinearidade e resolvida substituindo-se X,_ x , X,_ 2 , ..., por uma unica variarel, 
a saber, Y t _ x . Mas note os seguintes aspectos da transformapao de Koyck: 

1. Comepamos com um modelo de defasagens distribufdas, mas acabamos com um modelo autor- 
regressivo, porque Y ,_, aparece como uma das variaveis explanatorias. Essa transformapao mostra 
como se pode “converter” um modelo de defasagens distribufdas em um autorregressivo. 

2. O aparecimento de Y ,_, provavelmente cria alguns problemas estatfsticos. Y t _ u como Y,, e es- 
tocastico, o que significa que temos uma variavel explanatoria estocastica no modelo. Lembre-se 
de que a teoria classica de mfnimos quadrados fundamenta-se na premissa de que as variaveis 
explanatorias sao nao estocasticas ou, se forem, sao distribufdas independentemente do termo 
de erro estocastico. Daf, devemos descobrir se Y,_ x satisfaz esse pressuposto. (Retornaremos a 
esse ponto na Sepao 17.8.) 

3. No modelo original (17.3.1), o termo de erro era u„ enquanto no modelo transformado ele e v, = 
( u, — Xu,_ j). As propriedades estatfsticas de v, dependem do que se pressupoe sobre as propriedades 
estatfsticas de u,, pois, como sera mostrado depois, se os u, originais estiverem correlacionados serial- 
mente, os v, o serao. Portanto, podemos ter de enfrentar o problema da correlapao serial alem da 
variavel explanatoria estocastica Y t _ x . Faremos isso na Sepao 17.8. 

4. A presenpa de Y defasado viola um dos pressupostos subjacentes ao teste d de Durbin-Watson. 
Teremos de desenvolver uma alternativa para testar a correlapao serial na presenpa do Y defasado. 
Uma alternativa e o teste h de Durbin, discutido na Sepao 17.10. 

Como vimos na Equapao (17.1.4), ao efetuarmos as somas parciais dos /l, padronizados, temos a 
proporpao do impacto a longo prazo, ou total, sentido por um determinado perfodo de tempo. Na pra- 
tica, a defasagem media ou mediana e usada com frequencia para caracterizar a natureza da estrutura 
defasada de um modelo de defasagens distribufdas. 
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A defasagem mediana 

A defasagem mediana e o tempo exigido para completar a primeira metade, ou 50%, da mudanca 
total em Y que segue a uma alteragao unitaria em X. Para o modelo de Koyck, a defasagem mediana e 
a seguinte (veja o Exercicio 17.6): 

Modelo de Koyck: defasagem mediana = - ^ ^ (17.4.8) 

log X 

Assim, se X — 0,2, a defasagem mediana sera 0,4306, mas, se X = 0,8, a defasagem mediana sera 
3,1067. Em palavras, no primeiro caso, 50% da mudanga total em Y e realizada em menos da metade 
do perfodo, enquanto no ultimo leva mais de 3 perfodos para completar 50% da variagao. Mas esse 
contraste nao deveria surpreender, pois, como sabemos, quanto mais alto o valor de X, menor a velo- 
cidade do ajustamento, e quanto menor o valor de X, maior a velocidade do ajustamento. 


A defasagem media 

Contanto que todos os ft sejam positivos, a defasagem media e definida como 

Defasagem media = (17.4.9) 

Lo fa 


que e simplesmente a media ponderada de todas as defasagens envolvidas, com os respectivos coefi- 
cientes /3 servindo como pesos. Em suma, e a media ponderada das defasagens no tempo. Para o 
modelo de Koyck, a defasagem media e (ver Exercicio 17.7) 


Modelo de Koyck: defasagem media = 


X 

1 - X 


(17.4.10) 


Assim, se X = a defasagem media e 1. 

Da discussao anterior, fica claro que as defasagens media e mediana servem como uma medida 
sfntese da velocidade com a qual Y responde a X. No exemplo da Tabela 17.1, a defasagem media 
e de aproximadamente 11 trimestres, mostrando que leva algum tempo, em media, para que o efei- 
to das mudangas na oferta de moeda seja percebido na variagao de pregos. 


EXEMPLO 17.7 

Despesas de 
consumo pessoal 
per capita 
( DCPC ) e renda 
pessoal 
dispomvel per 
capita ( RPDPC ) 


Este exemplo examina as despesas de consumo pessoal per capita em relagao a renda 
pessoal disponfvel per capita, ambas expressas em dolares de 2000, para os Estados Unidos, 
para o perfodo de 1959-2006. Como ilustragao do modelo de Koyck, considere os dados 
apresentados na Tabela 1 7.2. A regressao de DCPC contra RPDPC e DCPC defasado deu os 
resultados da Tabela 1 7.3. 

A fungao consumo nessa tabela pode ser chamada de fun^ao consumo a curto prazo. 
Faremos a derivag:ao da fungao consumo de longo prazo rapidamente. 


Usando o valor estimado de X, podemos calcular os coeficientes da defasagens distribuf- 
das. Se /3 0 « 0,2139, ft = (0,21 39)(0,7971) ^ 0,1704, ft, = (0,21 39)(0,7971 ) 2 ^ 0,0231 
e assim por diante, que sao os multiplicadores de curto e medio prazo. Por fim, usando a 
Equagao (1 7.4.2), podemos obter o multiplicador de longo prazo, ou seja, o impacto total de 
variagao na renda sobre o consumo depois que todos os efeitos defasados forem levados em 
conta, o que no exemplo torna-se 

x>- *(i4x) =<°' 2139 ) (t^oWt) * 10537 


(Continua) 
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Ano 

DCPC 

RPDPC 

Ano 

DCPC 

RPDPC 

(Continuacao) 


1959 

8.776 

9.685 

1983 

15.656 

17.828 

TABELA 17.2 

1960 

8.873 

9.735 

1984 

16.343 

19.011 


1961 

8.873 

9.901 

1985 

17.040 

19.476 

DCPC e RPDPC 

1962 

9.170 

10.227 

1986 

17.570 

19.906 

1959-2006 

1963 

9.412 

10.455 

1987 

17.994 

20.072 

Fonte: Economic Report 

1964 

9.839 

11.061 

1988 

18.554 

20.740 

of the President, 2007, 

1965 

10.331 

11.594 

1989 

18.898 

21.120 

Tabela B-31. 

1966 

10.793 

12.065 

1990 

19.067 

21.281 


1967 

10.994 

12.457 

1991 

18.848 

21.109 


1968 

11.510 

12.892 

1992 

19.208 

21.548 


1969 

11.820 

13.163 

1993 

19.593 

21.493 


1970 

11.955 

13.563 

1994 

20.082 

21.812 


1971 

12.256 

14.001 

1995 

20.382 

22.153 


1972 

12.868 

14.512 

1996 

20.835 

22.546 


1973 

13.371 

15.345 

1997 

21.365 

23.065 


1974 

13.148 

15.094 

1998 

22.183 

24.131 


1975 

13.320 

15.291 

1999 

23.050 

24.564 


1976 

13.919 

15.738 

2000 

23.860 

25.469 


1977 

14.364 

16.128 

2001 

24.205 

25.687 


1978 

14.837 

16.704 

2002 

24.612 

26.217 


1979 

15.030 

16.931 

2003 

25.043 

26.535 


1980 

14.816 

16.940 

2004 

25.711 

27.232 


1981 

14.879 

17.217 

2005 

26.277 

27.436 


1982 

14.944 

17.418 

2006 

26.828 

28.005 


Notas: DCPC = Despesas de consumo pessoal per capita em dolares de 2000. 
RPDP = Renda pessoal disponfvel per capita em dolares de 2000. 


TABELA 17.3 


Dependent Variable: PPCE 

Method: Least Squares 

Sample (adjusted): 1960-2006 

Included observations: 47 after adjustments 


Coefficient Std. Error t Statistic Prob. 


C -252.9190 157.3517 -1.607348 0.1151 
PPDI 0.213890 0.070617 3.028892 0.0041 
PPCE(-1) 0.797146 0.073308 10.87389 0.0000 


F-squared 

0.998216 

Mean dependent var. 

16691.28 

Adjusted R-squared 

0.998134 

S.D. dependent var. 

5205.873 

S.E. of regression 

224.8504 

Akaike info criterion 

13.73045 

Sum squared resid. 

2224539. 

Schwarz criterion 

13.84854 

Log likelihood 

-319.6656 

Hannan-Quinn criter. 

13.77489 

F-statistic 

12306.99 

Durbin-Watson stat. 

0.961921 

Prob. (F-statistic) 

0.000000 

Durbin h = 3.8269* 



Em palavras, um aumento sustentado de um dolar na renda pessoal disponfvel per capita 
eventualmente levara a um aumento de cerca de 1,05 dolar nas despesas de consumo pes¬ 
soal per capita, sendo o impacto imediato, ou de curto prazo, de apenas 21 centavos. 

A fungao consumo a longo prazo agora pode ser escrita como: 

DCPC t = - 1247,1351 + 1,0537RPDPC t 


(' Continua ) 
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EXEMPLO 17.7 

( Continuagao ) 


Esta pode ser obtida dividindo-se a fun^ao consumo de curto prazo dada na Tabela 1 7.3 por 
0,2029 em ambos os lados e excluindo-se o termo defasado da renda pessoal disponfvel per 
capita . 13 

A longo prazo, a propensao marginal a consumir (PMC) e de aproximadamente 1. Isso 
significa gue, quando os consumidores tiverem tempo para habituarem-se ao aumento de 
um dolar na renda pessoal disponfvel per capita, aumentarao suas despesas de consumo pes¬ 
soal em quase um dolar. A curto prazo, no entanto, como mostra a Tabela 1 7.3, a PMC e de 
apenas 21 centavos. Qual e a razao para tamanha diferen^a entre a PMC a curto e a longo 
prazo? 

A resposta pode ser encontrada nas defasagens mediana e media. Dado A = 0,7971, a defa- 
sagem mediana e 


log(2) 

log A 


log(2) 

log(0,7971) 


3,0589 


e a defasagem media e 



3,9285 


Parece que as despesas de consumo pessoal reais ajustam-se a renda pessoal disponfvel com 
uma defasagem substancial: lembre-se de que, quanto maior for o valor de A (entre 0 e 1), 
mais tempo levara para que o impacto total de uma varia^ao no valor da variavel explanato¬ 
ry seja sentido sobre a variavel dependente. 


17.5 Racionaliza^ao do modelo de Koyck: 
o modelo de expectativas adaptativas 

Embora seja muito claro, o modelo de Koyck (17.4.7) e ad hoc, ja que foi obtido por um processo 
puramente algebrico; ele nao dispoe de base teorica. Mas essa desvantagem pode ser suplantada se 
adotarmos uma perspectiva diferente. Suponha o seguinte modelo: 

E /So T fi\ X t T Mt (17 5 1) 

em que Y = demanda por moeda (saldos reais em dinheiro) 

X* — taxa de juros de equilfbrio, otima, esperada a longo prazo ou normal 
u — termo de erro 

AEqua§ao (17.5.1) postula que a demanda por moeda e uma fun 5 ao da taxa de juros esperada (isto e, 
antecipada). 

Como a variavel de expectativa X* nao e diretamente observavel, propomos a seguinte hipotese 
sobre como as expectativas sao formadas: 


K - X U = Y(X t - Xl x ) 


(17.5.2) 14 


13 Em equilfbrio, todos os valores das despesas de consumo pessoal serao os mesmos. Portanto, DCPC,= DCPC M . 

Ao fazermos essa substituifao, deverfamos obter a fungao consumo a longo prazo. 
u As vezes o modelo e expresso como 

K- K i = 1 - K ,) 
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em que y, tal que 0 < y < 1,6 conhecido como o coeficiente de expectativa. A hipotese (17.5.2) e 
conhecida como a expectativa adaptativa, a expectativa progressiva ou a hipotese do aprendiza- 
do pelo erro, que Cagan 15 e Friedman 16 tornaram conhecida. 

A Equagao (17.5.2) implica que “os agentes economicos adaptarao suas expectativas de acordo 
com a experiencia passada e que, em particular, aprenderao com seus erros ”. 17 Mais especificamente, 
a Equa§ao (17.5.2) estabelece que as expectativas sao revistas a cada perfodo por uma fra 9 ao y da 
diferen 9 a entre o valor corrente da variavel e seu valor esperado anterior. Assim, para nosso modelo 
isso significaria que as expectativas sobre taxas de juro sao revistas a cada periodo por uma frapao y 
da discrepancia entre a taxa de juros observada no periodo corrente e o que foi seu valor previsto no 
periodo anterior. Outra forma de dizer isso seria escrever a Equagao (17.5.2) como 

x t = Y x t+ (. 1 - Y) x *~ i (17.5.3) 

que mostra que o valor esperado da taxa de juros no tempo t 6 uma media ponderada do valor obser- 
vado da taxa de juros no tempo t e seu valor esperado no periodo anterior, com pesos de y e 1 — y, 
respectivamente. Se y = 1, X*= X t , significando que as expectativas sao estaticas, ou seja, “condi- 
5 oes prevalentes hoje serao mantidas em todos os perfodos subsequentes. Os valores futuros espera- 
dos entao se tornam identicos aos valores atuais ”. 18 

Substituindo a Equa 9 ao (17.5.3) na Equagao (17.5.1), obtemos 

Y t = Po + Pi[Y x t + (1 - y) x t-i\ + u > (17 5 4) 

= Po + P\Y x t + P\(P ~ Y) X i-i + u t 

Agora defasamos a Equa 9 ao (17.5.1) de umperiodo, multiplicamos por 1 — ye subtrafmos o produto 
da Equa 9 ao (17.5.4). Depois de manipula 9 oes algebricas simples, obtemos 


Y t = yPo + YP\Xt + (1 - Y)Y t -1 + u, - (1 - y)u,- X 
- YPo + YP\ x t + (1 - Y) Y t -1 + Vt 


(17.5.5) 


em que v, = u, —(1 — y) u t _ 1 . 

Antes de prosseguirmos, observemos a diferen 9 a entre a Equa 9 ao (17.5.1) e a Equa 9 ao (17.5.5). 
Na primeira, p\ mede a resposta media de Y a uma varia 9 ao unitaria em X*, o valor de equilfbrio ou 
de longo prazo de X. Na Equa 9 ao (17.5.5), por outro lado, yp\ mede a resposta media de fa uma 
varia 9 ao unitaria no valor real ou observado de X. Essas respostas nao serao as mesmas, naturalmen- 
te, a menos que y = 1, isto e, os valores atual e de longo prazo de X sejam os mesmos. Na pratica, 
primeiro estimamos a Equa 9 ao (17.5.5). Uma vez obtida uma estimativa de y do coeficiente do Y 
defasado, podemos calcular facilmente P\ simplesmente dividindo o coeficiente de X, ( = y/1, j por y. 

A semelhanpa entre o modelo de expectativas adaptativas (17.5.5) e o modelo de Koyck 
(17.4.7) deve ser evidente, embora a interpretapao dos coeficientes nos dois modelos seja diferen- 
te. Observe que, como o modelo de Koyck, o de expectativas adaptativas e autorregressivo e seu 
termo de erro e similar ao de Koyck. Voltaremos a estima 9 ao do modelo das expectativas adapta¬ 
tivas na Se 9 ao 17.8 e a alguns exemplos na Se 9 ao 17.12. Agora que ja esbo 9 amos o modelo (EA), 
cabe perguntar: ate que ponto e realista? E verdade que ele e mais convincente que a abordagem 


15 CAGAN, P. "The monetary dynamics of hyperinflations". In: FRIEDMAN, M. (Ed.). Studies in the quantity theory 
of money. Chicago: University of Chicago Press, 1956. 

16 FRIEDMAN, M. A theory of the consumption function. National Bureau of Economic Research, Princeton, NJ: 
Princeton University Press, 1957. 

17 SHAW, C. K. Rational expectations: an elementary exposition. Nova York: St. Martin's Press, 1984. p. 25. 

18 Ibid., p. 19-20. 
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puramente algebrica de Koyck, mas a hipotese das expectativas adaptativas e razoavel? A seu fa¬ 
vor, podemos dizer o seguinte: 

Ele nos oferece um meio bem simples de modelar expectativas dentro da teoria economica enquanto 
postulamos um comportamento de parte dos agentes economicos que parece muito sensato. A crenfa 
de que as pessoas aprendem com a experiencia e, obviamente, um ponto de partida mais sensato que 
o pressuposto implicito de que elas sejam totalmente desprovidas de memoria, caracterfstica da tese 
das expectativas estaticas. Alem disso, a afirma5ao de que as experiences mais antigas influenciam 
menos que as mais recentes tambem esta de acordo com o senso comum e parece confirmar-se pela 
simples observa^ao . 19 

Ate aparecer a hipotese das expectativas racionais (ER), proposta inicialmente por J. Muth e 
mais tarde divulgada por Robert Lucas e Thomas Sargent, a hipotese das expectativas foi bastante 
popular na economia empirica. Os proponentes da hipotese das expectativas racionais (ER) afirmam 
que a hipotese das expectativas adaptativas e inadequada, porque depende apenas dos valores passa- 
dos de uma variavel para formular expectativas, 20 enquanto a hipotese das ER pressupoe “que os 
agentes economicos individuals recorrem a informa 5 oes atuais e relev antes, que estao disponiveis 
para formar suas expectativas, e nao contam apenas com a experiencia passada”. 21 Em suma, a hipo¬ 
tese das ER sustenta que as “expectativas sao ‘racionais’, no sentido de que incorporam eficientemen- 
te todas as informa 5 oes disponiveis no momento em que a expectativa e formulada”, 22 e nao apenas 
as informa 5 oes passadas. 

As criticas feitas pelos proponentes da hipotese das expectativas racionais contra a hipotese 
das expectativas adaptativas sao bem fundamentadas, embora a hipotese das expectativas racio¬ 
nais tambem tenha muitos crfticos. 23 Nao ha espa?o aqui para ficarmos incomodados em abordar 
esse material bastante complicado. Talvez possamos concordar com a afirmaqao de Stephen McNees: 
“No melhor dos casos, a premissa das expectativas adaptativas pode ser defendida apenas como uma 
‘hipotese de trabalho’, em lugar de um mecanismo mais complexo, talvez uma formulas ao de um 
mecanismo de expectativas cambiantes”. 24 


EXEMPLO 17.8 

Exemplo 17.7 
Revisto 


Como a transformafao de Koyck constitui a base do modelo de expectativas adaptativas, 
os resultados apresentados na Tabela 1 7.3 tambem podem ser interpretados em termos da 
Equagao (17.5.5). Assim y p 0 = —252,9190; y = 0,21389 e (1 — y) = 0,797146. Logo, o 
coeficiente de expectativa y ^ 0,2028, e, seguindo a discussao anterior sobre o modelo das 
EA, podemos dizer que cerca de 20% da discrepancy entre o DCPC efetivo e o esperado sao 
eliminados em um ano. 


17.6 Outra justificativa do modelo de Koyck: 

o modelo de ajuste de estoques ou de ajustamento parcial 


O modelo de expectativas adaptativas e uma maneira de justificar o modelo de Koyck. Outra 
forma e fomecida por Marc Nerlove no chamado modelo de ajuste parcial (MAP) ou de ajuste de 


19 Ibid., p. 27. 

20 Como o modelo de Koyck, podemos mostrar que, sob o modelo EA, as expectativas de uma variavel sao uma 
media ponderada exponencialmente dos valores passados dessa variavel. 

21 SHAW, G. K. op. cit., p. 47. Para mais detalhes da hipotese ER, veja SHEFFRIN, S. M. Rational expectations. Nova 
York: Cambridge University Press, 1983. 

22 McNEES, S. K. "The Phillips curve: forward- or backward-looking?”. New England Economic Review, jul./ago. 
1979. p. 50. 

23 Para uma avaliafao critica recente da hipotese ER, veja LOVELL, M. C. "Test of the rational expectations hypothesis". 
American Economic Review, p. 110-124, mar. 1966. 

24 McNEES, S. K. op. cit., p. 50. 
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estoque. 23 Para ilustrar esse modelo, considere o modelo do acelerador flexivel da teoria economi¬ 
ca, que supoe que exista uma quantidade de equilibria, otima, desejada ou a longo prazo, de estoque 
de capital necessario para produzir uma dada produgao de acordo com determinado estado de tecno- 
logia, taxa de juros etc. Para simplificarmos, suponhamos que esse nivel desejado de capital Y* seja 
uma fungao linear da produgao X como se segue: 


y; = fa + p x X, + u t (17.6.1) 

Uma vez que o nivel desejado de capital nao e diretamente observavel, Nerlove postula a seguinte 
hipotese, conhecida como hipotese de ajuste parcial, ou de ajuste de estoques: 


Y t - U_! = Hr; - Y t -{) 


(17.6.2) 26 


em que 8, tal que 0 < 8 < 1,6 conhecido como o coeficiente de ajuste e em que Y, — Y t _ 1 — mudan- 
5 a efetiva; e (Y* — Y,_ 1 ) mudanga desejada. 

Ja que Y, — Y t _\, a variagao no estoque de capital entre dois perfodos, nao e nada alem do inves- 
timento, a Equagao (17.6.2) pode, alternativamente, ser escrita como 

I t = 8(Y; - U_0 (17.6.B) 

em que I, = investmento no perfodo t. 

A Equagao (17.6.2) postula que a variagao efetiva do estoque de capital (investimento) em qual- 
quer perfodo dado, f, e uma fragao 8 da variagao desejada para aquele perfodo. Se 8 = 1, isso signifi- 
ca que o estoque real de capital e igual ao estoque desejado; ou seja, o estoque real ajusta-se ao 
estoque desejado imediatamente (no mesmo perfodo de tempo). Entretanto, se 8 = 0, isso significa 
que nada muda, uma vez que o estoque real no tempo feo mesmo que aquele observado no perfodo 
anterior. Costuma-se esperar que 8 situe-se entre esses dois extremos, ja que o ajustamento ao estoque 
de capital desejado tende a ser incompleto devido a rigidez, inercia e obrigagoes contratuais etc. — 
daf o nome de modelo de ajuste parcial. Note que o mecanismo de ajustamento (17.6.2) tambem 
pode ser escrito como: 

Y t = 8Y;+ ( 1 - (17.6.4) 


mostrando que o estoque de capital observado no tempo t e uma media ponderada do estoque de 
capital desejado naquele perfodo e do estoque de capital existente no perfodo de tempo anterior, 8 e 
(1 — 5) sendo os pesos. Agora, a substituigao da Equagao (17.6.1) pela Equagao (17.6.4) resulta em: 


Yt = S(A>+ fax t + u,)+ (l- 5)r,_t 
= 5/3 0 + 8PiX t + (1 - 8)Y t - 1 + Su , 


(17.6.5) 


Esse modelo e chamado de modelo de ajuste parcial (MAP). 

Uma vez que a Equagao (17.6.1) representa a demanda por estoque de capital de longo prazo ou 
de equilfbrio, a Equagao (17.6.5) pode ser chamada de fungao de demanda de curto prazo por estoque 
de capital, pois a curto prazo o estoque de capital existente pode nao ser necessariamente igual ao seu 
nfvel a longo prazo. Uma vez estimada a fungao de curto prazo (17.6.5) e obtida a estimativa do coe¬ 
ficiente de ajuste 8 (do coeficiente de Y t _{), podemos derivar facilmente a fungao de longo prazo, 
dividindo S t 6 0 e 8f J > t por 8 e omitindo o termo Y defasado, que entao dara a Equagao (17.6.1). 


25 NERLOVE, Marc. Distributed lags and demand analysis for agricultural and other commodities. Op. cit. 

26 Alguns autores nao acrescentam o termo de erro u t a relagao (1 7.6.1), mas o acrescentam a esta relagao, acre- 
ditando que, se a primeira for realmente uma relagao de equilfbrio, nao ha escopo para o termo de erro, en- 
quanto o mecanismo de ajuste pode ser imperfeito e exigir o termo de erro. Vale mencionar que a Equagao 
(1 7.6.2) as vezes tambem e escrita como 

Y t - Y t -i = «(»£, - n-i) 
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FIGURA 17.6 

O ajuste gradual do 
estoque de capital. 



Em termos geometricos, o modelo de ajuste parcial pode ser mostrado como na Figura 17.6. 27 
Nela, Feo estoque de capital desejado e Y u o estoque de capital real e efetivo. Para fins de ilustra- 
£ao, suponha que S = 0.5. Isso implica que a empresa planeja trabalhar com metade da defasagem da 
diferenga entre o estoque desejado e efetivado a cada perfodo. Assim, no primeiro perfodo, ela se 
move para Y 2 , com o investimento igual a (Y 2 — K,), o que, por sua vez, e igual a ( Y * * — Y^. Em cada 
perfodo subsequente, ele reduz pela metade a diferen£a entre o estoque de capital no infcio do perfo¬ 
do e o estoque de capital desejado Y*. 

O modelo de ajuste parcial assemelha-se ao modelo de Koyck e ao das expectativas adaptativas 
sob o ponto de vista de que tambem e autorregressivo. Mas seu termo de erro e muito mais simples: 
o termo de erro original, u t , multiplicado por uma constante S. Mas e preciso lembrar que, embora 
tenham uma aparencia semelhante, as expectativas adaptativas e os modelos de ajuste parcial sao 
conceitualmente muito diferentes. O primeiro baseia-se na incerteza (sobre o futuro comportamento 
de prccos, das taxas de juros etc), ja em relaqao ao ultimo, a incerteza deve-se a rigidez tecnica ou 
institucional, a inercia, ao custo da mudanca etc. No entanto, teoricamente, ambos os modelos sao 
muito mais confiaveis que o de Koyck. 

Uma vez que as expectativas adaptativas e os modelos de ajuste parcial tem uma aparencia indis- 
tingufvel, o y de 0,2028 do modelo das expectativas adaptativas tambem pode ser interpretado como 
o coeficiente <5 do modelo de ajuste do estoque se supusermos que este ultimo funciona no presente 
caso (isto e, e o DCPC desejado ou especado que esta relacionado linearmente ao RPDP corrente). 

E importante lembrar que, como os modelos de Koyck, das expectativas adaptativas e do ajus¬ 
te de estoques — deixando de lado a diferen§a na aparencia do termo de erro —, resultam no 
mesmo modelo final de estimacjao, devemos estar extremamente atentos ao dizer ao leitor qual 
modelo o pesquisador esta usando e por que. Assim, os pesquisadores devem especificar as bases 
do modelo que empregam. 


*17.7 Combina^ao dos modelos de expectativas adaptativas 
e de ajustamento parcial 

Considere o seguinte modelo: 

Y* = A) + P\X*t + u t (17.7.1) 

em que Y* = estoque de capital desejado eX*= rn'vel esperado de produ 5 ao. 


* Opcional. 

27 Esta e adaptada da Figura 7.4 de DORNBUSCH, Rudiger; FISCHER, Stanley. Macroeconomics. 3 ed. Nova York: 
McGraw-Hill, 1984. p. 216. 
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Como nem Y* nem X* sao diretamente observaveis, podemos usar o mecanismo de ajuste partial 
para Y*c o modelo de expectativas adaptativas para X*para chegar a seguinte equa^ao estimavel (veja 
o Exerticio 17.2): 

Y, = My + MvXt + [(1 - y) + (l - «)]r,-i 

- (1 - 5)(1 - y)Y t . 2 + [ 8u t - 5(1 - ' J ‘ 2) 

— oiq + u\X t + oiiYt -1 + 0:3 Yf -2 + v t 


em que v, — S[u, — (1 — y)u,_i\. Este modelo tambem e autorregressivo, sendo que a unica diferen- 
5a do modelo de expectativas adaptativas e que Y t _ 2 aparece junto com Y ,_, como uma variavel 
explanatoria. Como os modelos de Koyck e de ER, o termo de erro na Equacjao (17.7.2) segue um 
processo media movel. Outro aspecto desse modelo e que embora o modelo seja linear nos a, ele nao 
e linear nos parametros originais. 

Uma aplica9ao reconhecida da Equa5ao (17.7.1) tem sido a hipotese de renda permanente de 
Friedman, que estabelece que o consumo de longo prazo ou “permanente” e uma fun5ao da renda 
de longo prazo ou “permanente”. 28 

A estimacplo da Equayao (17.7.2) apresenta os mesmos problemas de estimayao que os do mode¬ 
lo de Koyck ou de ER, no sentido de que todos sao autorregressivos com estruturas semelliantes de 
erros. Alem disso, a Equagao (17.7.2) envolve alguns problemas de estima5ao nao linear que iremos 
considerar rapidamente no Exercfcio 17.10, mas nao nos aprofundaremos neste livro. 


17.8 Estima^ao dos modelos autorregressivos 

De nossa discussao ate aqui, temos tres modelos: 


Koyck 


Yt— «(1 - k) + PoX t + XY t _ 1 + v, 

( 17 . 4 . 7 ) 

Expectativas adaptativas 

Yf= yP 0+ YP\X t + (1 - y)Y t -1 + [u t - (1 - y)u t - 1] 

( 17 . 5 . 5 ) 

Ajustamento parcial 

Y,= Sp 0 + Sp x X l+ (1- S)Y t -i+ Su t 

( 17 . 6 . 5 ) 

Todos esses modelos tem a seguinte forma em comum: 

Y t = ao + oi\X t + a 2 Y t -1 + v t 

( 17 . 8 . 1 ) 


ou seja, todos tem natureza autorregressiva. Portanto, agora devemos examinar o problema de estima- 
gao de tais modelos, porque a teoria classica dos mlnimos quadrados pode nao ser diretamente aplica- 
vel a ties. Duas sao as razoes: a presen9a de variaveis explanatorias estocasticas e a possibilidade 
de correlagao serial. 

Agora, como foi observado, para a aplica9ao da teoria classica dos mmirnos quadrados, deve-se 
mostrar que a variavel explanatoria estocastica Y t _\ e distribulda de modo independente do termo de 
erro v,. Para determinarmos se isso acontece, e essencial conhecermos as propriedades de v,. Se supu- 
sermos que o termo de erro original u, satisfaz todos os pressupostos classicos, tal que E(u t ) = 0, var 
(, u,) = o 2 (o pressuposto da homocedasticidade), e cov (u t , u, +s ) = 0 para s ^ 0 (o pressuposto da 


28 


FRIEDMAN, Milton. A theory of consumption function. Princeton, NJ: Princeton University Press, 1957. 
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ausencia de autocorrela^ao), v, pode nao herdar todas essas propriedades. Considere, por exemplo, o 
termo de erro no modelo de Koyck, que tv,— (u, — \u,_{). Dados os pressupostos acerca de u t , po- 
demos mostrar facilmente que v, esta correlacionado serialmente, porque 

E(v t v t -i) = - Act 2 (17.8.2) 29 

que e diferente de zero (a nao ser que A seja zero). E, uma vez que Y,_ 1 aparece no modelo de Koyck 
como variavel explanatoria, ela tendera a ser correlacionada com v, (atraves da presen^a de u,_ 1 nela). 
E posslvel demonstrar que 

cov [Y t -\, (; u , - Am,_i)] = - Act 2 (17.8.B) 

que e igual a Equac^ao (17.8.2). O leitor pode verificar que isso ocorre com o modelo de expectativas 
adaptativas. 

Qual a implicacjao de constatar que no modelo de Koyck e tambem no modelo de expectativas 
adaptativas a variavel explanatoria estocastica Y ,_, esta correlacionada com o termo de erro v,l Como 
observado, se uma variavel explanatoria em um modelo de regressao esta correlacionada com o 
termo de erro estocastico, os estimadores de MQO nao sao apenas tendenciosos, mas tambem 
nao sao consistentes; ou seja, mesmo que o tamanho da amostra aumente indcfinidamcntc, os 
estimadores nao se aproximam de seu verdadeiro valor populacional . 30 Portanto, a cstimacao 
dos modelos de Koyck e adaptativo pelo procedimento usual de MQO pode levar a resultados 
seriamente equivocados. 

Contudo, o modelo de ajuste parcial e diferente. Nele v, = Su„ em que ()<<$< 1. Logo, se u, satis- 
faz os pressupostos do modelo classico de regressao linear dado anteriormente, o mesmo ocorre com 
Su,. Assim, a estimagao de MQO do modelo de ajuste parcial rendera estimativas consistentes, embora 
tendam a ser tendenciosas (em amostras finitas ou pequenas). 31 Intuitivamente, a razao para a consis¬ 
tency e: embora Y ,_, dependa de u,_\ e de todos os termos de erro anteriores, ele nao esta relacionado 
ao termo de erro u,. Contanto que u, seja independente serialmente, Y t _\ tambem sera independente ou 
pelo menos nao estara correlacionado com u t , satisfazendo assim um pressuposto importante do MQO, 
a saber, o da nao correla^ao entre as variaveis explanatorias e o termo de erro estocastico. 

Embora a estima 5 ao por MQO do modelo de ajuste parcial ou do de estoque nos proporcione 
uma estima 5 ao consistente devido a estrutura simples do termo de erro, nao deverfamos imaginar 
que ele se aplique melhor que o modelo de Koyck ou das expectativas adaptativas. 32 O leitor e 
aconselhado a nao fazer isso, um modelo deveria ser escolhido com base em considera 5 oes teori- 
cas rigorosas, e nao simplesmente porque possibilita uma estima 5 ao estatlstica facil. Todo modelo 
deveria ser considerado por seu proprio merito, prestando-se atengao ao aparecimento de termos 
de erro estocasticos. Se, em modelos como o de Koyck ou o das expectativas adaptativas, os MQO 
nao puderem ser aplicados diretamente, e preciso encontrar formas de resolver o problema de 
estimayao. Existem varios metodos alternatives, embora alguns deles sejam trabalhosos, do ponto 
de vista do calculo. Na se 9 ao a seguir veremos um deles. 


29 E (v t v t - "1 ) = E{u t - 1 - ku t - 2) 

= -kE(u t - 1) 2 ja que as covariancias entre os u sao zero por suposifao. 

= —k<7 2 

30 A demonstragao esta alem do escopo deste livro e pode ser encontrada em Griliches, op. cit., p. 36-38. Con¬ 
tudo, o Capitulo 18 apresenta um esbofo da demonstrafao em outro contexto. Veja tambem Maeshiro, Asa- 
toshi. "Teaching regressions with a lagged dependent variable and autocorrelated disturbances". The journal of 
Economic Education, v. 27, n. 1, p. 72-84, 1996. 

31 Para a demonstragao, veja JOHNSTON, J. Econometric methods. 3. ed. Nova York: McGraw-Hill, 1984. p. 360-362. 
Veja tambem DORAN, H. E.; GUISE, j. W. B. Single equation methods in econometrics: applied regression analysis. 
Armidale, NSW, Australia: University of New England Teaching Monograph Series 3, 1984, p. 236-244. 

32 Tambem, como j. Johnston observa (op. cit., p. 350), "[o] padrao de ajustamento [sugerido pelo modelo de 
ajustamento] [...] as vezes pode nao ser plausivel". 
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17.9 O metodo de variaveis instrumentais (VI) 

Os MQO nao podem ser aplicados ao modelo de Koyck ou das expectativas adaptativas, porque 
a variavel explanatoria Y t _ l tende a estar correlacionada com o termo de erro v f . Se de algum modo a 
correla 5 ao puder ser removida, pode-se aplicar os MQO para obter estimativas consistentes, como 
observado anteriormente. ( Observe: havera um pequeno vies de amostra.) Como isso pode ser feito? 
Liviatan propos a seguinte sokujao . 33 

Suponhamos que encontremos uma proxy para Y,_ que esteja altamente correlacionada com Y,_ h 
mas nao com v t , em que v t e o termo de erro que aparece no modelo de expectativas adaptativas ou de 
Koyck. Tal proxy e chamada de variavel instrumental (VI ). 34 Liviatan sugere X,_ l como a variavel 
instrumental para Y ,_, e tambem que os parametros da regressao (17.8.1) possam ser obtidos resol- 
vendo as seguintes equaqoes normais: 

Y Yt = na 0 + a x Y X, + a 2 Y. Y,_ i 

Y Y ‘ x ‘ = “o Y Xi + “i H x t + «2 Y Y <- iXi o 7 - 9 - 1 ) 

Y Y t X t - j = a 0 Y X <-1 + «i Y X < Xt ~ i + “2 Y Y ‘~ lXl ~ 1 

Note que, se tivessemos de aplicar os MQO diretamente a Equagao (17.8.1), as equagoes MQO 
normais seriam (veja a Seqao 7.4): 

Y ‘ = n “o + “i Y X * + «2 Y Y t - i 

Y Y ‘ x > = “o Y Xt + “i Y x ‘ + “ 2 H Yt - iXt (17 - 9 - 2) 

Y Y ‘ Y <-i = «oY Y >-' + «iY x ‘ Y <-' + ^Y y ‘-i 

A diferen?a entre os dois conjuntos de equa 9 oes normais deveria ficar imediatamente evidente. 
Liviatan mostrou que os a estimados da Equa 5 ao (17.9.1) sao consistentes, enquanto aqueles estima- 
dos na Equa 9 ao (17.9.2) podem nao ser consistentes, pois Y t _ { e v, [= u, — Xu,_ x ou u, — (1 — y)u,_ J 
podem estar correlacionados enquanto X, e X,_ l nao estao correlacionados com v',. (Por que?) Embo- 
ra seja facil de aplicar, uma vez encontrada a proxy adequada, a tecnica de Liviatan tende a ser afe- 
tada pelo problema da multicolinearidade, porque X, e X t _ h que entram nas equagoes normais de 
(17.9.1), tendem a estar altamente correlacionadas (como observado no Capftulo 12, a maioria das 
series temporais economicas costuma exibir um alto grau de correla 9 ao entre valores sucessivos). A 
implicagao e que, embora o procedimento de Liviatan gere estimativas consistentes, os estimadores 
tendem a ser ineficientes . 35 

Antes de prosseguirmos, surge uma pergunta obvia: como se encontra uma “boa” proxy para Y,_ \ 
de maneira que, embora esteja altamente correlacionada a Y t _\, ela nao esteja correlacionada com v t l 
Na literatura especifica, encontramos algumas sugestoes que empregaremos como exercicio (veja o 
Exercfcio 17.5). Porem, deve-se deixar claro que nem sempre e facil encontrar boas proxies, e nesse 
caso o metodo das variaveis instrumentais e de pouca valia e podemos ter de recorrer as tecnicas de 
estima 9 ao de maxima verossimilhan 9 a, que estao alem do escopo deste livro . 36 


33 LIVIATAN, N. "Consistent estimation of distributed lags". International Economic Review, jan. 1963. p. 44-52, 
v. 4. 

34 Essas variaveis instrumentais sao usadas com frequencia nos modelos de equa^ao simultaneos (veja o Capftulo 20). 

35 Para ver como a eficiencia dos estimadores pode ser aprimorada, consulte KLIEN, Lawrence R. A textbook of 
econometrics. 2. ed. Englewood Cliffs, NJ: Prentice-Hall, 1974. p. 99. Veja tambem GREENE, William H. Econometric 
analysis. 2. ed. Nova York: Macmillan, 1993 p. 535-538. 

36 Para uma discussao sucinta dos metodos de maxima verossimilhanfa, veja JOHNSTON, J.op. cit., p. 366-371, 
bem como o Apendice 4A e o Apendice 15A. 
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Existe algum teste que possa ser usado para verificar se as variaveis instrumentais escolhidas sao 
validas? Dennis Sargan formulou um teste, chamado de teste de SARG, com esse objetivo. Ele sera 
descrito no Apendice 17A, Se£ao 17AE 


17.10 Detectando a autocorrela^ao em modelos autorregressivos: 
o teste h de Durbin 


Como vimos, a probabilidade de haver correlagao serial nos termos de erros, v r , torna o problema 
da estimapao de modelos autorregressivos bastante complexo: no modelo de ajuste de estoques, o 
termo de erro, v t , nao apresentaria correlagao serial (de primeira ordem) se o termo de erro do mode¬ 
lo original, n,, nao estivesse serialmente correlacionado, enquanto nos modelos de Koyck e das ex- 
pectativas adaptativas, v, estaria correlacionado serialmente, mesmo se u, fosse serialmente independente. 
A questao, entao, e: como sabemos se ha correlapao serial no termo de erro que aparece nos modelos 
autorregressivos? 

Como observado no Capitulo 12, a estatistica d de Durbin-Watson nao pode ser usada para detectar 
correla£ao serial (de primeira ordem) em modelos autorregressivos, porque nesses modelos o valor 
calculado de d em geral tende para 2, que e o valor esperado de d em uma sequencia verdadeiramen- 
te aleatoria. Em outras palavras, se calcularmos rotineiramente a estatistica d para tais modelos, ha- 
vera um vies embutido que impede que se descubra a correlagao serial (de primeira ordem). Apesar 
disso, muitos pesquisadores calculam o valor d por falta de melhor alternativa. Contudo, recentemen- 
te o proprio Durbin propos um teste de corrclacao serial de primeira ordem para modelos autorregres¬ 
sivos em grandes amostras? 1 Este e chamado de estatistica h. 

Ja discutimos o teste h de Durbin no Exercicio 12.36. Por conveniencia, reproduzimos a estatisca 
h (com uma ligeira mudanpa de notapao): 


h = 


P 


n 

1 - n[var(a2)] 


( 17 . 10 . 1 ) 


em que ne o tamanho da amostra; var (d 2 ) e a variancia do Y, ( = Y,_\) defasado na Equa 5 ao (17.8.1); e 
pea estimativa da correla 5 ao serial de primeira ordem p, discutida pela primeira vez no Capitulo 12. 

Como observado no Exercicio 12.36, para uma amostra grande, Durbin demonstrou que, sob a 
hipotese nula p = 0, a estatistica h da Equa 5 ao (17.10.1) segue a distribui^ao normal padrao. Ou 
seja, 

h 3sy ~N(0, 1) ( 17 . 10 . 2 ) 


em que asy significa assintoticamente. 

Na pratica, como observado no Capitulo 12, pode-se estimar p como 



( 17 . 10 . 3 ) 


E interessante observar que, embora nao possamos usar o d de Durbin para testar a autocorrela 5 ao nos 
modelos autorregressivos, podemos usa-lo como parte do calculo da estatistica h. 

Vamos ilustrar o uso da estatistica h com nosso Exemplo 17.7. Neste exemplo, n = 47, p (1 — d/2) 
— 0,5190 ( observe: d — 0,9619) e var (a 2 ) = var (DCPC,_]) = (0,0733)2 = 0,0053. Colocando esses 
valores na Equapao (17.10.1), obtemos: 


h = 0,5190. 


47 


1 - 47(0,0053) 


= 4,1061 


( 17 . 10 . 4 ) 


37 


DURBIN, J. "Testing for serial correlation in least-squares regression when some of the regressors are lagged 
dependent variables". Econometrica, 1970. p. 410-421, v. 38. 









634 Parte Tres Topicos em econometria 


Como esse valor h tem a distribu^ao normal padrao sob a hipotese nula, a probabilidade de obter um 
valor elevado de h e muito pequena. Lembre-se de que a probabilidade de uma variavel normal padrao 
superar o valor de ± 3 e extremamente pequena. No exemplo, nossa conclusao e que ha autocorre- 
layao (positiva). Evidentemente, lembre-se de que h segue a distribuigao normal padrao assintotica- 
mente. Nossa amostra de 47 observa£6es e razoavelmente grande. 

Note esses aspectos da estatfstica h: 

1. Nao importa quantas variaveis X ou quantos valores defasados de Y estao incluidos no modelo de 
regressao. Para calcular h, precisamos considerar apenas a variancia do coeficiente do Y t _ x defasado. 

2. O teste nao sera aplicavel se [n var (d 2 )] for maior que 1. (Por que?) Na pratica, no entanto, em geral isso 
nao acontece. 

3. Como o teste e para grandes amostras, sua aplicapao em pequenas amostras nao se justifica rigo- 
rosamente, como mostrado por Inder 38 e Kiviet. 39 Foi sugerido que o teste de Breusch-Godfrey 
(BG), tambem conhecido como o teste do multiplicador de Lagrange, discutido no Capftulo 12, e 
mais eficiente estatisticamente nao so nas amostras grandes, mas tambem nas amostras finitas ou 
pequenas e, portanto, e preferivel ao teste h. 40 

A conclusao baseada no teste li, de que nosso modelo e afetado pela autocorrelac^ao, e confirma- 
da pelo teste de Breusch-Godfrey (BG), apresentado na Equa£ao (12.6.17). Usando os sete valores 
defasados dos resfduos estimados por meio da regressao mostrada na Tabela 17.3, o teste BG da 
Equa§ao (12.6.18) obteve um valor y' 1 de 15,3869. Para sete graus de liberdade (o numero de resf- 
duos defasados usados no teste BG), a probabilidade de obter um valor de qui-quadrado de 15,38 ou 
maior e cere a de 3%, o que e bem baixo. 

Por essa razao, precisamos corrigir os erros padrao na Tabela 17.3, o que pode ser feito pelo pro- 
cedimento de Newey-West HAC discutido no Capftulo 12. Os resultados sao semelhantes aos da 
Tabela 17.4. 

Parece que os MQO subestimam os erros padrao dos coeficientes de regressao. 


TABELA 17.4 


Dependent Variable: PCE 

Method: Least Squares 

Sample (adjusted): 1960-2006 

Included observations: 47 after adjustments 

Newey-West HAC Standard Errors & Covariance (lag truncation =3) 


Coefficient Std. Error t Statistic 

Prob. 

C 

PPDI 

PPCE (-1) 

-252.9190 168.4610 -1.501350 

0.213890 0.051245 4.173888 

0.797146 0.051825 15.38148 

0.1404 

0.0001 

0.0000 

R -squared 

Adjusted J?-squared 
S.E. of regression 
Sum squared resid. 
Log likelihood 
F-statistic 

Prob.(F-statistic) 

0.998216 Mean dependent var. 

0.998134 S.D. dependent var. 

224.8504 Akaike info criterion 

2224539. Schwarz criterion 

-319.6656 Hannan-Quinn criter. 

12306.99 Durbin-Watson stat. 

0.000000 

16691.28 

5205.873 

13.73045 

13.84854 

13.77489 

0.961921 


38 INDER, B. "An approximation to the null distribution of the Durbin-Watson statistic in models containing lagged 
dependent variables". Econometric Theory, 1986. v. 2, n. 3, p. 41 3-428. 

39 KIVIET, J. F. "On the vigour of some misspecification tests for modelling dynamic relationships". Review of Economic 
Studies, 1986. v. 53, n. 1 73, p. 241-262. 

40 KOROSI, Gabor; MATYAS, Laszlo; SZEKELY, Istvan P. Practical econometrics. Brookfield, Vermont: Ashgate 
Publishing Company, 1992. p. 92. 
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17.11 Um exemplo numerico: a demanda por moeda no Canada, 
primeiro trimestre de 1979 ao quarto trimestre de 1988 

Para ilustrar o uso dos modelos discutidos ate aqui, considere uma das aplicagoes empfricas ante- 
riores: a demanda de moeda (ou saldos monetarios reais). Em particular, considere o modelo a se- 


guir. 


41 


M* = /S 0 ^f 1 P/V 


(17.11.1) 


em que M*— demanda por moeda desejada, ou de longo prazo (saldos monetarios reais) 

R t = taxa de juros de longo prazo, % 

Y, — trenda nacional agregada real 

Para a estimagao estatfstica, a Equagao (17.11.1) pode ser expressa convenientemente em forma 
logantmica como 


In M* = In jSq + /Si In R t + ft 2 In Y t + u, 


(17.11.2) 


Como a variavel de demanda desejada nao pode ser diretamente observavel, supomos a seguinte 
hipotese de ajuste de estoque: 


M t = / m; y 

M,-i \ M t -1 / 


0 < S < 1 


(17.11 . 3 ) 


A Equagao (17.11.3) estabelece que uma porcentagem constante (por que?) da discrepancia entre 
os saldos monetarios real desejado e o efetivo seja eliminada em um linico perfodo (ano). Na forma 
logarftmica, a Equagao (17.11.3) pode ser expressa como 

In M t — lnM,_i = 5(ln M* - lnM,_i) (17.11.4) 

Substituindo In M *da Equagao (17.11.2) na Equagao (17.11.4) e rearranjando, obtemos 


In M t - (Sln/lo + P\S\nR t + ^5In Y, + (1 - (5)lnM r _i + 8u t (17.11.5) 42 

o que pode ser chamado dc funcdo demanda no curto prazo por moeda. (Por que?) 

Como ilustragao da demanda por saldos monetarios reais, de curto e longo prazo, considere os 
dados apresentados na Tabela 17.5. Os dados trimestrais referem-se ao Canada, para o perfodo de 
1979 a 1988. As variaveis sao definidas como se segue: M (como definido pela oferta de moeda Ml, 
dolares canadenses [C$], milhoes), P (deflator implicito dos pregos, 1981 = 100), PIB a pregos cons- 
tantes de 1981 (C$, milhoes) e R (taxa preferencial de juros para 90 dias, %). 43 Ml foi deflacionado 
por P para obter dados para saldos monetarios reais. A priori, espera-se que a demanda real por moe¬ 
da relacione-se positivamente ao PIB (efeito renda positivo) e negativamente com R (quanto mais alta 
for a taxa de juros, maior sera o custo de oportunidade de reter moeda, ja que Ml paga muito pouco 
juro, se pagar). 


41 Para um modelo semelhante, veja CHOW, Gregory C. "On the long-run and short-run demand for money". 
journal of Political Economy, 1966. v. 74, n. 2, p. 111-1 31. Note que uma vantagem da fungao multiplicativa e 
que os expoentes das variaveis dao estimativas diretas de elasticidades (veja o Capftulo 6). 

42 Vale mencionar que este modelo e essencialmente nao linear nos parametros. Portanto, embora o MQO possa 
dar uma estimativa nao tendenciosa de, por exemplo, faS em conjunto, podera nao nos oferecer estimativas 
nao tendenciosas de /f| e 3 individualmente, principalmente se a amostra for pequena. 

43 Estes dados sao obtidos de BHASKAR RAO, B. (Ed.). Cointegration for the applied economist. Nova York: St. 
Martin's Press, 1994. p. 210-21 3. Os dados originals sao do primeiro trimestre de 1956 ao quarto trimestre de 
1988, mas para fins de ilustragao comegamos nossa analise do primeiro trimestre de 1979. 
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TABELA 17.5 

Moeda, taxa de juros, 
rndice de pregos e 
PIB, Canada 

Fonte: RAO, op. cit., 
p. 210-213. 


Observafao 

Ml 

R 

P 

PIB 

1979-1 

22.175,00 

11,13333 

0,77947 

334.800 

1979-2 

22.841,00 

11,1666 7 

0,80861 

336.708 

1979-3 

23.461,00 

11,80000 

0,82649 

340.096 

1979-4 

23.427,00 

14,18333 

0,84863 

341.844 

1980-1 

23.811,00 

14,38333 

0,86693 

342.776 

1980-2 

23.612,33 

12,98333 

0,88950 

342.264 

1980-3 

24.543,00 

10,71667 

0,91553 

340.716 

1980-4 

25.638,66 

14,53333 

0,93743 

347.780 

1981-1 

25.316,00 

17,13333 

0,96523 

354.836 

1981-2 

25.501,33 

18,56667 

0,98774 

359.352 

1981-3 

25.382,33 

21,01666 

1,01314 

356.152 

1981-4 

24.753,00 

16,61665 

1,03410 

353.636 

1982-1 

25.094,33 

15,35000 

1,05743 

349.568 

1982-2 

25.253,66 

16,04999 

1,07748 

345.284 

1982-3 

24.936,66 

14,31667 

1,09666 

343.028 

1982-4 

25.553,00 

10,88333 

1,11641 

340.292 

1983-1 

26.755,33 

9,616670 

1,12303 

346.072 

1983-2 

27.412,00 

9,316670 

1,13395 

353.860 

1983-3 

28.403,33 

9,333330 

1,14721 

359.544 

1983-4 

28.402,33 

9,550000 

1,16059 

362.304 

1984-1 

28.715,66 

10,08333 

1,17117 

368.280 

1984-2 

28.996,33 

11,45000 

1,17406 

376.768 

1984-3 

28.479,33 

12,45000 

1,17795 

381.016 

1984-4 

28.669,00 

10,76667 

1,18438 

385.396 

1985-1 

29.018,66 

10,51667 

1,18990 

390.240 

1985-2 

29.398,66 

9,666670 

1,20625 

391.580 

1985-3 

30.203,66 

9,033330 

1,21492 

396.384 

1985-4 

31.059,33 

9,016670 

1,21805 

405.308 

1986-1 

30.745,33 

11,03333 

1,22408 

405.680 

1986-2 

30.477,66 

8,733330 

1,22856 

408.116 

1986-3 

31.563,66 

8,466670 

1,23916 

409.160 

1986-4 

32.800,66 

8,400000 

1,25368 

409.616 

1987-1 

33.958,33 

7,250000 

1,27117 

416.484 

1987-2 

35.795,66 

8,300000 

1,28429 

422.916 

1987-3 

35.878,66 

9,300000 

1,29599 

429.980 

1987-4 

36.336,00 

8,700000 

1,31001 

436.264 

1988-1 

36.480,33 

8,616670 

1,32325 

440.592 

1988-2 

37.108,66 

9,133330 

1,33219 

446.680 

1988-3 

38.423,00 

10,05000 

1,35065 

450.328 

1988-4 

38.480,66 

10,83333 

1,36648 

453.516 


Notas: Ml = C$, milhoes. 

P = deflator implicito dos pregos (1981 = 100). 
R = taxa preferencial de juros para 90 dias, %. 
PIB = C$, milhoes (pregos de 1981). 


Os resultados da regressao sao os seguintes: 44 


44 Note este aspecto dos erros padrao estimados. O erro padrao, por exemplo, o coeficiente de In R t refere-se ao erro 
padrao de p i S, um estimador de p^S. Nao ha uma maneira simples de obter os erros padrao de ft e S individual- 
mente com base no erro padrao de Pi S, principalmente se a amostra for relativamente pequena. Para amostras 
grandes, no entanto, os erros padrao individuals d e 8 podem ser obtidos aproximadamente, mas os calculos 
sao complexos. Veja KMENTA, Jan Elements of econometrics, Nova York: Macmillan, 1971. p. 444. 





Capitulo 1 7 Modelos econometricos dinamicos: modelos autorregressivos e com defasagens distribm'das 637 


In M, = 0,8561 - 0,06341ntf, - 0,0237 In PIB, + 0,9607 In A/,_ j 

ep = (0,5101) (0,0131) (0,0366) (0,0414) 

t= (1,6782) (-4,8134) (-0,6466) (23,1972) 

R 2 = 0,9482 d= 2,4582 F= 213,7234 


(17.11.6) 


A funcjao de demanda estimada de curto prazo mostra que a elasticidade dos juros a curto prazo tem 
o sinal correto e que e estatisticamente significativa, ja que seu valor p e quase zero. A elasticidade 
renda de curto prazo e surpreendentemente negativa, embora estatisticamente nao seja diferente 
de zero. O coeficiente de ajustamento e S = (1 — 0.9607) = 0,0393, e isso implica que apenas 
cerca de 4% da discrepancia entre os saldos monetarios efetivo e desejado sejam eliminados em um 
trimestre, um ajustamento bastante lento. 

Para voltar a fun 9 ao demanda de longo prazo (17.11.2), basta dividir a funcao demanda de curto 
prazo por S (por que?) e excluir o termo In M t _\. Os resultados sao: 

1 nM? = 21,7888- 1,6132In- 0,60301nPTB (17.11.7) 45 

Como se pode ver, a elasticidade da demanda por moeda de longo prazo em rela^ao a taxa de 
juros e substancialmente maior (em termos absolutos) que a correspondente elasticidade de curto 
prazo, o que tambem e valido para a elasticidade-renda, embora, no presente caso, seu significado 
economico e estatfstico seja dubio. 

Observe que o d estimado de Durbin-Watson e 2,4582, que esta proximo de 2. Isso fundamenta 
nossa observa 5 ao anterior de que nos modelos autorregressivos o d calculado em geral e proximo de 
2. Portanto, nao deveriamos confiar no d calculado para constatar se houve correla§ao serial em nos- 
sos dados. O tamanho da amostra em nosso caso sao 40 observa 9 des, o que pode ser razoavelmente 
grande para aplicar o teste h. No presente caso, o leitor pode verificar que o valor h estimado e 
— 1,5008, o que nao e significativo a 5% de probabilidade, talvez sugerindo que nao haja autocorre- 
la 9 ao de primeira ordem no termo de erro. 


17.12 Exemplos ilustrativos 

Nesta se 9 ao apresentamos alguns exemplos dos modelos de defasagens distribm'das para mostrar 
como os pesquisadores os empregam em estudos empiricos. 


EXEMPLO 17.9 

O Fed e a taxa 
de juros real 


Para avaliar o efeito de M^ (moeda manual + demanda por depositos) sobre um indicador de 
taxa de juros real de titulos de primeira linha, C. J. Santoni e Courtenay C. Stone 46 estimaram, com 
base em dados mensais, o seguinte modelo de defasagens distribufdas para os Estados Unidos. 


n 

r t = constante + ^o,A4 t _, + u, 
/=o 


( 17 . 12 . 1 ) 


em que r t = indice de Moody para titulos de primeira linha menos a taxa media (dos 36 me- 
ses anteriores) de variafao anual no indice dessazonalizado de prefos ao consumidor, usado 
como indicador da evolufao da taxa de juros real; e M t = crescimento mensal M,. 


( Continua ) 


45 Note que nao apresentamos os erros padrao dos coeficientes estimados por razoes discutidas na nota de roda- 
pe 44. 

46 "The Fed and the real rate of interest". Review, Federal Reserve Bank of St. Louis, dez. 1982. p. 8-18. 
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EXEMPLO 17.9 

(' Continuagao ) 


TABELA 17.6 

Influencia da 
variafao mensal de 
Ml sobre o 
indicador da taxa 
de juros real para 
os tftulos de 
primeira linha: 
fevereiro de 1951 a 
novembro de 1982 

Fonte: SANTONI, G. J.; 
STONE, Courtenay C. 
“The Fed and the real 
rate of interest”. Review, 
Federal Reserve Bank of 
St. Louis, p. 16, dez. 
1982. 


De acordo com a "doutrina da neutralidade da moeda", as variaveis economicas 
reais — como produgao, emprego, crescimento economico e taxa de juros real — nao 
sao influenciadas permanentemente pela expansao da moeda e, portanto, sao essen- 
cialmente inalteradas pela polltica monetaria. Dado esse argumento, o FED (o Banco 
Central americano) nao influencia permanentemente a taxa real de juros de forma al- 
guma. 47 

Se essa doutrina for valida, deverfamos esperar que os coeficientes o„ bem como seus 
somatorios, sejam estatisticamente nao diferentes de zero. Para descobrir se e esse o caso, 
os autores estimaram a Equag:ao (17.12.1) para dois perfodos diferentes, fevereiro de 
1 951 a setembro de 1979 e outubro de 1979 a novembro de 1982, o ultimo consideran- 
do a mudanga na polltica monetaria do FED, que desde outubro de 1979 tern prestado 
mais aten^ao a taxa de crescimento da oferta de moeda do que a taxa de juros, que foi a 
polltica no perlodo anterior. Os resultados da regressao sao apresentados na Tabela 1 7.6 
e parecem apoiar a "doutrina da neutralidade da moeda", ja que, para o perlodo de fe¬ 
vereiro de 1951 a setembro de 1979, a variagao da moeda corrente e defasada nao teve 
efeito estatisticamente significativo sobre o indicador de taxa de juros. No mesmo perlo¬ 
do, a doutrina da neutralidade tambem parece ter encontrado respaldo, pois, estatistica¬ 
mente, 2 Zoj nao e diferente de zero; apenas o coeficiente a t e significativo, mas tern o sinal 
errado. (Por que?) 


ii 

r= constante + J2 i t _, 
/= o 



Fevereiro 1951 a 

Setembro 1979 

Outrubro 1979 a 
Novembro 1982 

Coefciente 

Ifl* 

Coefciente 

Ifl* 

Constante 

1,4885 f 

2,068 

1,0360 

0,801 

GO 

-0,00088 

0,388 

0,00840 

1,014 

0^ 

0,00171 

0,510 

0,03960 t 

3,419 

02 

0,001 70 

0,423 

0,03112 

2,003 

o 3 

0,00233 

0,542 

0,02719 

1,502 

0 4 

-0,00249 

0,553 

0,00901 

0,423 

o 5 

-0,00160 

0,348 

0,01940 

0,863 

o 6 

0,00292 

0,631 

0,02411 

1,056 

07 

0,00253 

0,556 

0,01446 

0,666 

os 

0,00000 

0,001 

-0,00036 

0,019 

09 

0,00074 

0,181 

-0,00499 

0,301 

o 10 

0,00016 

0,045 

-0,01126 

0,888 

Oil 

0,00025 

0,107 

-0,00178 

0,211 

E a, 

0,00737 

0,221 

0,1549 

0,926 

R 2 

0,9826 


0,8662 


D-W 

2,07 


2,04 


RH01 

1,27 f 

24,536 

1,40+ 

9,838 

RH02 

-0,28 t 

5,410 

-0,48+ 

3,373 

NOB 

344, 


38, 


SER ( = RSS) 

0,1548 


0,3899 



*lrl = Valor absoluto t. 

f Significativamente diferente de zero no nivel de 0,05. 


47 


Idid. p. 15. 
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EXEMPLO 17.10 

O consumo 
agregado a curto e a 
longo prazo para o 
Sri Lanka, 1967- 
1993. 


Suponha que o consumo C relacione-se linearmente a renda permanente X*: 

C t = j6i + p 2 X* + u t (17.12.2) 

Uma vez que X\ nao e diretamente observavel, precisamos especificar o mecanismo que gera 
renda permanente. Suponha a hipotese de expectativas adaptativas especificada na Equa^ao 
(1 7.5.2). Usando a Equa^ao (1 7.5.2) e simplificando, obtemos a seguinte equagao para esti- 
mar (confira (1 7.5.5)): 

C( = a-\ + a 2 Xf + of 3 Cf_ 1 + Vt (17.12.3) 

em que = yPt 

a 2 = yP 2 

Of 3 = (1 - y) 

v f = K - (1 - Y)u t - 1] 

Como sabemos, p 2 da a resposta media do consumo, por exemplo, um aumento de $1 na 
renda permanente, enquanto a 2 da a resposta media de consumo para um aumento de $1 
na renda corrente. 

Dos dados anuais para o Sri Lanka, para o perfodo de 1967-1993 dado na Tabela 1 7.7, os 
seguintes resultados de regressao foram obtidos: 48 

C = 1038,403 + 0,4043X t + 0,5009C t , 

ep= (2501,455) (0,0919) (0,1213) (17.12.4) 

t= (0,4151) (4,3979) (4,1293) 

R 2 = 0,9912 d= 1,4162 F= 1298,466 

em que C = gastos de consumo privado e X = PIB, ambos a pre^os constantes. Tambem in- 
troduzimos a taxa de juros real no modelo, mas nao foi estatisticamente significativa. 

Os resultados mostram que a propensao marginal a consumir (PMC) e de 0,4043, suge- 
rindo que o aumento de 1 rupia na renda real corrente ou observada (medida pelo PIB real) 
aumentaria o consumo medio em cerca de 0,40 rupia. Mas, se o aumento da renda for man- 
tido, finalmente a PMC gerada da renda permanente sera p 2 = yP 2 /y = 0,4043/0,4991 = 
0,8100, ou cerca de 0,81 rupia. Em outras palavras, quando os consumidores tiverem tido 
tempo para ajustarem-se a varia^ao de uma rupia na renda, eles aumentarao seu consumo 
em cerca de 0,81 rupia. 

Agora suponha que nossa fungao consumo seja: 

C* = fa + PiXt+ u t (17.12.5) 

Nessa formula^ao, o consumo permanente ou de longo prazo C t e uma fungao linear da 
renda corrente ou observada. Uma vez que C t nao e diretamente observavel, vamos recorrer 
ao modelo de ajuste parcial (1 7.6.2). Usando esse modelo e depois de manipulates algebri- 
cas, obtemos 


C t = SPt + Sp 2 X t + (1 - 5)C t i + Su t 
= ofi + a 2 Xt+ of 3 C i + Vt 


(17.12.6) 


Aparentemente, esse modelo e indistingufvel do modelo de expectativas adaptativas 
(1 7.12.3). Portanto, os resultados de regressao dados em (1 7.12.4) sao igualmente aplicaveis 
aqui. Entretanto, ha uma grande diferenga na interpretagao dos dois modelos, para nao 
mencionar o problema de estima^ao associado com o carater autorregressivo e a possfvel 
correlagao serial do modelo (1 7.12.3). 

( Continua ) 


Os dados sao obtidos do disco de dados do livro de CHANDAN Mukherjee; HOWARD, White e MARC, Wuyts. 
Econometrics and data analysis for developing countries. Nova York: Routledge, 1998. Os dados originais sao das 
tabelas do Banco Mundial. 
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EXEMPLO 17.10 

(' Continuagao ) 


TARFI A 17 7 


Observacao 

CONPriv 

PIB 

Observacao 

CONPriv 

PIB 

Gastos de consumo 

privado e PIB. Sri 

1967 

61.284 

78.221 

1981 

120.477 

152.846 

Lanka 

1968 

68.814 

83.326 

1982 

133.868 

164.318 

1969 

76.766 

90.490 

1983 

148.004 

172.414 

Fonte: veja a nota de 
rodape 48. 

1970 

73.576 

92.692 

1984 

149.735 

178.433 

1971 

73.256 

94.814 

1985 

155.200 

185.753 


1972 

67.502 

92.590 

1986 

154.165 

192.059 


1973 

78.832 

101.419 

1987 

155.445 

191.288 


1974 

80.240 

105.267 

1988 

157.199 

196.055 


1975 

84.477 

112.149 

1989 

158.576 

202.477 


1976 

86.038 

116.078 

1990 

169.238 

223.225 


1977 

96.275 

122.040 

1991 

179.001 

233.231 


1978 

101.292 

128.578 

1992 

183.687 

242.762 


1979 

1980 

105.448 

114.570 

136.851 

144.734 

1993 

198.273 

259.555 


Notas: CONPriv = gastos de consumo privado. 
PIB = Produto Interno Bruto. 


O modelo (1 7.12.5) e a fun^ao consumo de longo prazo, ou equilibrio, enquanto o mo- 
delo (1 7.12.6) e a fungdo consumo a curto prazo. y 0 2 mede a PMC de longo prazo, enquanto 
ot 2 (= S/3 2 ) da a PMC de curto prazo; a primeira pode ser obtida da segunda dividindo-a por 
S, o coeficiente de ajuste. 

Voltando a (17.12.4), agora podemos interpretar 0,4043 como a PMC de curto prazo. 
Uma vez que S = 0,4991, a PMC de longo prazo e 0,81. Note que o coeficiente de ajusta- 
mento de aproximadamente 0,50 sugere que em qualquer perfodo de tempo os consumido- 
res so ajustam a metade do consumo que seria necessario para atingir seu nfvel desejado ou 
de longo prazo. 

Este exemplo toca no ponto crucial de que, aparentemente, os modelos de expectativas 
adaptativas e de ajustamento parcial, ou o modelo de Koyck sao tao semelhantes que nao 
conseguimos distinguir qual e a especifica^ao correta apenas examinando a regressao esti- 
mada, como a Equafao (1 7.12.4). E por isso que e tao vital que se especifique o modelo es- 
colhido para analise empfrica e, entao, proceda-se adequadamente. Se o habito ou inercia 
caracteriza o comportamento de consumo, o modelo de ajuste parcial e adequado. Por outro 
lado, se o comportamento de consumo e projetado, no sentido de que se baseia nas futuras 
expectativas de renda, o modelo de expectativas adaptativas e adequado. Nesse caso, tere- 
mos de prestar atengao ao problema de estima^ao para obter estimadores consistentes. No 
primeiro caso, o MQO fornecera estimadores consistentes, contanto que os pressupostos de 
MQO sejam respeitados. 


17.13 A abordagem de Almon aos modelos de defasagens 
distribmdas: a distribuigao polinomial 
de defasagens ou de Almon 19 

Embora seja muito usado, o modelo de defasagens distribuidas de Koyck baseia-se no pressupos- 
to de que os coeficientes ft diminuem geometricamente a medida que a defasagem aumenta (veja a 
Figura 17.5). Essa premissa pode ser restritiva demais em algumas situa£6es. Considere, por exem¬ 
plo, a Figura 17.7. 


49 


ALMON, Shirley. "The distributed lag between capital appropriations and expenditures". Econometrica, jan. 
1965. v. 33, p. 178-196. 
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Na Figura 17.7a supoe-se que os ft aumentem e em seguida diminuam, enquanto na Figura 17.7c 
supoe-se que eles sigam um padrao cfclico. Obviamente, os modelos de defasagens distribuldas de 
Koyck nao funcionarao nesses casos. No entanto, depois de examinar as Figuras 17.7a e c, parece que 
se pode expressar ft, como fun§ao de i, a duragao da defasagem (de tempo), e ajustar curvas adequa- 
das para refletir a relag ao funcional entre as duas, como indicado nas Figuras 17.7ft e cl. Essa aborda- 
gem e exatamente a sugerida por Shirley Almon. Para ilustrar sua tecnica, retomemos o modelo de 
defasagens distribuldas finitas considerado anteriormente: 

Y, = a + ftoX, + \ + ftiXt-i +-1- ftkXt-k + Ut (17.1.2) 

Que pode ser escrito mais sinteticamente como 

k 

Y t = a + ft,X,-i + Ut (17.13.1) 

i = 0 

Seguindo um teorema em matematica conhecido como teorema de Weierstrass, Almon su- 
poe que ft, pode ser aproximado por um polinomio de grau adequado em i, a dura 5 ao da defasa¬ 
gem. 50 Por exemplo, se o esquema de defasagem mostrado na Figura 17.7a pode ser aplicado, 
podemos escrever 


FIGURA 17.7 

Esquema polinomial 
de defasagens de 
Almon. 


0 12 3 7 

Defasagem 


(a) 


Pi 



Defasagem 

(b) 



50 


De modo geral, o teorema afirma que em um intervalo fechado finito qualquer fungao contlnua pode ser apro- 
ximada uniformemente por um polinomio de um grau adequado. 
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Pi = a 0 + a\i + a 2 i 2 (17.13.2) 

que e um polinomio quadratico, ou de segundo grau, em i (veja a Figura 11 .lb). No entanto, se os p 
seguirem o padrao da Figura 17.7c, podemos escrever 

P, = a 0 + a\i + a 2 i 2 + a 2 i 2 (17.13.3) 

que e um polinomio de terceiro grau em i (veja a Figura 11.Id). Em termos gerais, podemos escrever 

Pi = a 0 +ad + a 2 i 2 + ■■■+ a m i m (17.13.4) 


que e um polinomio de m-esimo grau em i. Supoe-se que m (o grau do polinomio) seja menor que k 
(a duragao maxima da defasagem). 

Para explicar como funciona o esquema de Almon, suponhamos que os P sigam o padrao mostra- 
do na Figura 17 .la e, portanto, a aproximagao polinomial de segundo grau seja adequada. Substituindo 
a Equagao (17.13.2) na Equagao (17.13.1), obtemos 

k 

Y, = a + ^^(ao + «i i + a 2 i 2 )X t -i + it, 

‘ = \ k t (17.13.5) 

= a + ao E Xt-i + ax^iXt-i + a 2 J2 i2x >-‘ + u < 

1=0 i= 0 1 = 0 

Definindo 

k 

Zot = 

i = 0 

Zu=J2 iX ‘-‘ (17.13.6) 

1 = 0 
k 

z 2t = J2 [2x ‘-‘ 

i= 0 

podemos escrever a Equagao (17.13.5) como 

Y t = a + aoZo t + a\Z\ t + a 2 Z 2 t + u t (17.13.7) 


No esquema de Almon, faz-se a regressao de Y contra as variaveis Z construldas, e nao contra 
as variaveis originais X. Note que a Equagao (17.13.7) pode ser estimada pelo procedimento usual 
de MQO. As estimativas de a e a, obtidas assim terao todas as propriedades estatfsticas desejadas, 
contanto que o termo de erro estocastico u satisfaga as premissas do modelo classico de regressao 
linear. A esse respeito, a tecnica de Almon tem vantagem sobre o metodo de Koyck, porque, como 
vimos, este ultimo apresenta serios problemas de estimagao que resultam da presenga da variavel 
explanatoria estocastica Y,_ x e sua provavel correlagao com o termo de erro. 

Uma vez estimados os a da Equagao (17.13.7), os p originais podem ser estimados da Equagao 
(17.13.2) (em termos mais gerais, da Equagao (17.13.4)) como se segue: 

Po = do 

Pi = do + d\ + a 2 

p 2 = d 0 + 2d, + 4d 2 ( 17 . 13 . 8 ) 

p 2 = do + 3d\ + 9ct 2 


Pk = do + kdi + k 2 a 2 

Antes de aplicarmos a tecnica de Almon, devemos resolver os seguintes problemas: 
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1. A duragao maxima da defasagem k deve ser especificada antecipadamente. Aqui, talvez se 
possa seguir a orientagao de Davidson e MacKinnon: 

O melhor procedimento provavelmente seja primeiro resolver a questao da duragao da defasagem, co- 

megando com um valor muito grande de q [a duragao da defasagem] e verificando se o ajustamento do 

modelo deteriora-se significativamente quando o reduzimos sem impor qualquer restrigao na forma das 

defasagens distribuldas. 51 

Lembre-se de que, se ha uma duragao “verdadeira” da defasagem, escolher uma defasagem pe- 
quena leva ao “vies da omissao de uma variavel relevante”, cujas consequencias, como vimos no 
Capitulo 13, podem ser muito serias. Por outro lado, escolher uma defasagem maior que o necessario 
levara ao “vies da inclusao de variaveis irrelevantes” cujas consequencias sao menos serias; os coe- 
ficientes podem ser estimados consistentemente pelo MQO, embora suas variancias possam ser me¬ 
nos eficientes. 

Pode-se usar o criterio de infonnacdo de Akaike ou de Schwarz discutido no Capitulo 13 para 
escolher a duragao adequada da defasagem. Esses criterios tambem podem ser usados para discutir o 
grau adequado do polinomio, levando adiante a discussao feita no ponto 2 . 

2. Tendo especificado k, tambem devemos especificar o grau do polinomio m. Em geral, o grau do 
polinomio deveria ser de pelo menos um a mais do que os pontos de inflexao da curva que relaciona 
/l, a i. Assim, na Figura 1 1 .la ha apenas um ponto de inflexao; logo, um polinomio de segundo grau 
sera uma boa aproximagao. Na Figura 17.7c existem dois pontos de inflexao; logo, um polinomio de 
terceiro grau fornecera uma boa aproximagao. Contudo, a priori podemos desconhecer o numero 
de pontos de inflexao existentes e, dessa forma, a escolha de m e altamente subjetiva. Porem, a teoria 
pode sugerir um modo especifico em alguns casos. Na pratica, espera-se que um polinomio de grau 
mais alto (por exemplo, m = 2 ou 3) de bons resultados. Tendo escolhido determinado valor de m, se 
desejamos verificar se um polinomio de grau mais alto proporcionara um melhor ajustamento, pode¬ 
mos proceder da forma apresentada a seguir. 

Suponha que devemos decidir entre polinomios de segundo e terceiro graus. Para o polino¬ 
mio de segundo grau, a equagao de estimagao e aquela dada pela Equagao (17.13.7). Para o 
polinomio de terceiro grau a equagao correspondente e 

Y t = a + aoZo t + a\Z\ t + a 2 Z 2t + a^Zi, + u, (17.13.9) 

em que Z 3 , = i 3 A,_,. Depois de efetuar a regressao (17.13.9), se constatamos que a 2 e estatis- 
ticamente significativo mas a 3 nao e, podemos pressupor que o polinomio de segundo grau fornece 
uma aproximagao razoavelmente boa. 

Por outro lado, como Davidson e MacKinnon sugerem, “depois que q [a duragao da defasagem] for 
determinado, poderemos tentar determinar d [o grau do polinomio] uma vez mais, comegando com um 
valor grande e entao reduzindo .” 52 

Entretanto, devemos estar atentos ao problema da multicolinearidade, que provavelmente aparece 
em virtude da forma como os Z sao construfdos por meio dos X, como mostra a Equagao (17.13.6) 
(veja tambem a Equagao (17.13.10)). Como vimos no Capitulo 10, em casos de seria multicolineari¬ 
dade, a 3 pode mostrar-se estatisticamente insignificante, nao porque o verdadeiro a 3 e zero, mas 
simplesmente porque a amostra que temos nao nos permite avaliar o impacto separado de Z 3 sobre Y. 
Portanto, em nosso exemplo, antes de aceitarmos a conclusao de que o polinomio de terceiro grau nao 
e a escolha correta, devemos nos certificar de que o problema da multicolinearidade nao e tao grave, 
o que poderemos fazer se aplicarmos tecnicas discutidas no Capitulo 10. 

3. Uma vez que m e k sao especificados, os Z podem ser construfdos imediatamente. Por exemplo, 
se m = 2 e k = 5, os Z sao 


51 DAVIDSON, Russel; MACKINNON, James G. Estimation and inference in econometrics. Nova York: Oxford Univer¬ 
sity Press, 1993. p. 675-676. 

52 Ibid., pp. 675-676. 
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5 

Zo, = J2 X ‘-‘ = ( x < + x ,-i + *i-2 + ^-3 + X,. A + X,-s) 

i= 0 
5 

Z L , = = (X t — \ + 2X,-2 + 3A ,_ 3 + 4X,- 4 + 5X,-s) (17.13.10) 

i=0 

5 

Z 2 , = J2 i2 X t -i = (X t - 1 + 4X,_ 2 + 9X,-1 + l6X,-4 + 25X r -s) 

<=o 

Note que os Z sao combinapoes lineares dos X originais. Observe tambem por que os Z provavel- 
mente mostram multicolinearidade. 

Antes de passar para o exemplo numerico, observe as vantagens do metodo de Almon. Primeiro, 
ele fornece um metodo flexivel de incorporar uma variedade de estruturas de defasagem (veja o Exer- 
cicio 17.17). A tecnica de Koyck, por outro lado, e bem rigida no sentido de que pressupoe que os /S 
declinem geometricamente. Em segundo lugar, ao contrario da tecnica de Koyck, no metodo de Almon 
nao temos de ficar preocupados com a presenga da variavel dependente defasada como uma variavel 
explanatoria no modelo e nos problemas que ele cria para estimapao. Por fim, se um polinomio de 
grau suficientemente baixo puder ser ajustado, o numero de coeficientes a serem estimados (os a) sera 
consideravelmente menor que o numero original de coeficientes (os ft). 

Vamos voltar a ressaltar a tecnica de Almon. Primeiro, o grau do polinomio e o valor maximo da 
defasagem sao, em grande parte, uma decisao subjetiva. Em segundo lugar, por razoes apresentadas 
anteriormente, as variaveis Z provavelmente exibem multicolinearidade. Portanto, em modelos como 
a Equa 5 ao (17.13.9), os a estimados provavelmente mostram grandes erros padrao (relativos aos 
valores desses coeficientes), resultando, dessa forma, em um ou mais coeficientes estatisticamente 
insignificantes com base no teste t convencional. Mas isso nao significa necessariamente que um ou 
mais dos coeficientes originais ft tambem sejam estatisticamente insignificantes. (A demonstrapao 
dessa afirmapao e um tanto complexa, mas e sugerida no Exercicio 17.18.) Como resultado, o problema 
de multicolinearidade pode nao ser tao serio quanto poderfamos imaginar. Alem disso, como sabemos, 
em casos de multicolinearidade, mesmo que nao possamos estimar um coeficiente com exatidao, uma 
combinapao linear desses coeficientes (a funpao estimavel) pode ser estimada com mais exatidao. 


EXEMPLO 17.11 

Ilustragdo do 
modelo de 
defasagens 
distribuidas de 
Almon 


Para ilustrar a tecnica de Almon, a Tabela 1 7.8 apresenta dados sobre os estoques Y e 
vendas X para os Estados Unidos, para o periodo del 954-1999. 

Para fins ilustrativos, suponha que os estoques dependam das vendas no ano corrente e 
nos tres anos anteriores, como se segue: 

Y t = a+ A)X t + + p 2 X t -2 + /f 3 X t _ 3 + u t (17.13.11) 

Alem disso, suponha que ft, possa ser aproximado por um polinomio de segundo grau como o 
da Equapao (1 7.1 3.2). Entao, seguindo a Equapao (1 7.1 3.7), podemos escrever 


Yt — a + OoZot + Oi Zit + a 2 Z2t + Wt 


(17.13.12) 


em que 


3 

Z 0 t = = + X ‘-i+ X t-2+ M 

/= 0 
3 

Zit = /X t _/=(X t -i + 2X t -2+3X t - 3 ) (17.13.13) 

/= o 

3 

z 2 t = E /2 X f -/ = (Xt- 1 + 4Xf_ 2 + 9X f _ 3 ) 

/= o 


( Continua ) 
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EXEMPLO 17.11 As variaveis Z assim construfdas sao apresentadas na Tabela 1 7.8. Usando os dados em Yeos 
0 Continuagao ) Z ' obtemos a seguinte regressao: 

Y t = 25,845,06 + 1,1149Z 0t - 0,371 3Z lf - 0,0600Z 2t 



e P = 

(6596,998) 

(0,5381) 

(1,3743) 

(0,4549) 

(17.13. 


t = 

(3,9177) 

(2,0718) 

(- 0,2702) 

(- 0,1319) 




R 2 

= 0,9755 

d= 0,1643 

F= 517,7656 



Observe; uma vez 

que estamos usando uma 

defasagem 

de um ano, o 

numero total 


observances foi reduzido de 46 para 43. 




TABELA 17.8 

Observagao 

Estoques 

Vendas 

Z 0 


z 2 

Industria de 





transformajao dos 

1954 

41.612 

23.355 

NA 

NA 

NA 

Estados Unidos 

1955 

45.069 

26.480 

NA 

NA 

NA 

1956 

50.642 

27.740 

NA 

NA 

NA 

Fonte: Economic report of 

1957 

51.871 

28.736 

106.311 

150.765 

343.855 

the president, 2001, Tabela 

1958 

50.203 

27.248 

110.204 

163.656 

378.016 

B-57, p. 340. Os Z sao 
como mostrado na 

1959 

52.913 

30.286 

114.010 

167.940 

391.852 

Equagao (17.13.13). 

1960 

53.786 

30.878 

117.148 

170.990 

397.902 


1961 

54.871 

30.922 

119.334 

173.194 

397.254 

1962 

58.172 

33.358 

125.444 

183.536 

427.008 

1963 

60.029 

35.058 

130.216 

187.836 

434.948 

1964 

63.410 

37.331 

136.669 

194.540 

446.788 

1965 

68.207 

40.995 

146.742 

207.521 

477.785 

1966 

77.986 

44.870 

158.254 

220.831 

505.841 

1967 

84.646 

46.486 

169.682 

238.853 

544.829 

1968 

90.560 

50.229 

182.580 

259.211 

594.921 

1969 

98.145 

53.501 

195.086 

277.811 

640.003 

1970 

101.599 

52.805 

203.021 

293.417 

672.791 

1971 

102.567 

55.906 

212.441 

310.494 

718.870 

1972 

108.121 

63.027 

225.239 

322.019 

748.635 

1973 

124.499 

72.931 

244.669 

333.254 

761.896 

1974 

157.625 

84.790 

276.654 

366.703 

828.193 

1975 

159.708 

86.589 

307.337 

419.733 

943.757 

1976 

174.636 

98.797 

343.107 

474.962 

1.082.128 

1977 

188.378 

113.201 

383.377 

526.345 

1.208.263 

1978 

211.691 

126.905 

425.492 

570.562 

1.287.690 

1979 

242.157 

143.936 

482.839 

649.698 

1.468.882 

1980 

265.215 

154.391 

538.433 

737.349 

1.670.365 

1981 

283.413 

168.129 

593.361 

822.978 

1.872.280 

1982 

311.852 

163.351 

629.807 

908.719 

2.081.117 

1983 

312.379 

172.547 

658.418 

962.782 

2.225.386 

1984 

339.516 

190.682 

694.709 

1.003.636 

2.339.1 12 

1985 

334.749 

194.538 

721.118 

1.025.829 

2.351.029 

1986 

322.654 

194.657 

752.424 

1.093.543 

2.510.189 

1987 

338.109 

206.326 

786.203 

1.155.779 

2.688.947 

1988 

369.374 

224.619 

820.140 

1.179.254 

2.735.796 

1989 

391.212 

236.698 

862.300 

1.221.242 

2.801.836 

1990 

405.073 

242.686 

910.329 

1.304.914 

2.992.108 

1991 

390.905 

239.847 

943.850 

1.389.939 

3.211.049 

1992 

382.510 

250.394 

969.625 

1.435.313 

3.340.873 

1993 

384.039 

260.635 

993.562 

1.458.146 

3.393.956 

1994 

404.877 

279.002 

1.029.878 

1.480.964 

3.420.834 

1995 

430.985 

299.555 

1.089.586 

1.551.454 

3.575.088 

1996 

436.729 

309.622 

1.148.814 

1.639.464 

3.761.278 

1997 

456.133 

327.452 

1.215.631 

1.745.738 

4.018.860 

1998 

466.798 

337.687 

1.274.316 

1.845.361 

4.261.935 

1999 

470.377 

354.961 

1.329.722 

1.921.457 

4.434.093 


Nota: Y e X estao em milhoes de dolares, ajustados sazonalmente. 


( Continua ) 
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EXEMPLO 17.11 

( Continuagao ) 


Um breve comentario sobre os resultados anteriores e necessario. Das tres variaveis Z, 
apenas Z 0 e estatisticamente significativa, em termos individuals, no nfvel de 5%; no entanto, 
o valor de F e tao alto que podemos rejeitar a hipotese nula de que coletivamente os Z nao 
tern efeito sobre Y. Como voce pode suspeitar, isso poderia muito bem acontecer devido a 
multicolinearidade. Observe tambem que o valor de d calculado e muito baixo. Isso nao 
implica necessariamente que os resfduos sejam afetados pela autocorrelagao. E mais provavel 
que o baixo valor de dsugira que o modelo que usamos seja mal especificado. Faremos um 
breve comentario sobre isso. 

Dos a estimados, dados na Equagao (1 7.1 3.3), podemos estimar facilmente os ft originais, 
como mostrado na Equagao (1 7.1 3.8). No exemplo em questao, os resultados sao os seguintes: 


A = oo = 1,1149 
A = (do + Qi + d 2 ) = 0,6836 
A = (do + 2di + 4d 2 ) = 0,1 321 
A = (d 0 + 3di + 902 ) = - 0,5394 


(17.13.15) 


Assim, o modelo estimado de defasagens distribufdas correspondente a Equagao (1 7.1 3.11) e: 

(17.13.16) 


Y t = 25.845,0 + 1,1150X 0 + 0,6836X t _-, + 0,1 321 X t _ 2 - 0,5394X t _ 3 

ep = (6596,99) (0,5381) (0,4672) (0,4656) (0,5656) 

t= (3,9177) (2,0718) (1,4630) (0,2837) (-0,9537) 


Ceometricamente, os fy estimados da Figura 1 7.8. 
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Nosso exemplo pode ser usado para destacar alguns aspectos adicionais do procedimento de de¬ 
fasagem de Almon: 

1. Os erros padrao dos coeficientes a sao obtidos diretamente da regressao de MQO (17.13.14), mas 
os erros padrao de alguns dos coeficientes 0, nosso objetivo principal, nao podem, mas podem ser 
deduzidos dos erros padrao dos coeficientes a estimados, usando-se uma formula conhecida da 
estatfstica, dada no Exercfcio 17.18. Naturalmente, nao ha necessidade de fazer isso manual- 
mente, pois a maioria dos programas estatisticos faz isso. Os erros padrao dados na Equagao 
(17.13.15) foram obtidos do EViews 6. 

2. Os ft obtidos na Equagao (17.13.16) sao chamados de estimativas irrestritas no sentido de que 
nao ha restrigoes a priori colocadas sobre eles. Em algumas situagoes, podemos querer impor 
as chamadas restrigSes de ponto extremo aos ft, supondo que ft 0 e ft k (o A:-esimo coeficiente 
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de defasagem e o corrente) sejam zero. Devido a razoes psicologicas, institucionais ou tecni- 
cas, o valor da variavel explanatoria no periodo corrente pode nao ter qualquer impacto sobre 
o valor corrente do regressando, justificando assim o valor de zero para /3 0 . Pela mesma logica, 
alem de um certo tempo, o k-esimo coeficiente defasado pode nao ter qualquer impacto sobre 
o regressando, sustentando assim o pressuposto de que f} k e zero. Em nosso exemplo do es- 
toque (o Exemplo 17.11), o coeficiente de A,_ 3 tinha um sinal negativo, o que pode nao fazer 
sentido economico. Dai, pode-se desejar restringir tal coeficiente a zero. 53 Evidentemente, 
voce nao precisa restringir ambos os extremos; poderia colocar a restrigao apenas no primeiro 
coeficiente, chamado de extremo proximo, ou ao ultimo, chamado de coeficiente distante. Para 
o exemplo dos estoques, isso e ilustrado no Exercfcio 17.28. As vezes os /I sao estimados com 
a restrigao de que sua soma seja 1. Mas nao deverfamos colocar tais restrigoes despreocupada- 
mente, pois afetam os valores dos demais coeficientes defasados (nao restritos). 

3. Uma vez que a escolha do niimero de coeficientes defasados, bem como do grau do polinomio, e 
feita discricionariamente pelo pesquisador, e inevitavel errar e tentar varias especificagoes e, por- 
tanto, tal pratica e sujeita a acusagao de data mining. E ai que os criterios de informagao de 
Akaike e Schwarz, discutidos no Capitulo 13 podem ser uteis. 

4. Uma vez que estimamos a Equagao (17.13.16) usando tres defasagens e o polinomio de segundo 
grau, trata-se de um modelo de mmimos quadrados restritos. Suponha que decidamos usar as tres 
defasagens mas nao a abordagem polinomial de Almon. Ou seja, estimamos a Equagao (17.13.11) 
pelos MQO. E entao? Primeiro vejamos os resultados: 


Y, = 26,008,60 

+ 0,977 IX, + 

l,0139A r _i - 

0,2022 X,- 2 ~ 

0,393 5X,_ 3 

ep = (6691,12) 

(0,6820) 

(1,0920) 

(1,1021) 

(0,7186) 

t= (3,8870) (1,4327) 

R 2 = 0,9755 

(0,9284) 

d= 0,1571 

(-0,1835) 

F= 379,51 

(- 0,5476) 


Se compararmos esses resultados com os da Equagao (17.13.16), veremos que no geral R 2 e pra- 
ticamente o mesmo, embora o padrao defasado em (17.13.17) mostre uma forma curvamais acentuada 
que a exibida pela Equagao (17.13.16). A verificagao do valor de R 2 com base na Equagao (17.13.16) 
devera ser feita pelo leitor. 

Como este exemplo ilustra, e preciso ter cuidado para usar a tecnica de defasagens distribufdas de 
Almon, ja que os resultados poderiam ser sensiveis a escolha do grau do polinomio e/ou ao numero 
de coeficientes defasados. 


17.14 


Causalidade em economia: o teste de causalidade de Granger 


54 


Voltando a Segao 1.4 observamos que, embora a analise de regressao lide com a dependencia de 
uma variavel sobre outras variaveis, ela nao implica necessariamente causagao. Em outras palavras, 
a existencia de uma relagao entre variaveis nao prova causalidade ou a diregao da influencia. Mas, em 
regressoes envolvendo dados de series temporais, a situagao pode ser um pouco diferente, porque, 
como coloca o autor, 

[. . .] o tempo nao volta. Ou seja, se o evento A acontece antes do evento B, entao e possfvel que A es- 
teja causando B. No entanto, nao e possfvel que B esteja causando A. Em outras palavras, os eventos 
passados podem levar ao acontecimento de eventos no presente. Os eventos futuros nao podem [grifo 
nosso]. 55 


53 Para uma aplicagao concreta, veja BATTEN, D. B.; THORNTON, Daniel. "Polynomial distributed lags and the 
estimation of the St. Louis equation". Review, Federal Reserve Bank of St. Louis, abr. 1983. p. 1 3-25. 

54 Existe outro teste de causalidade que as vezes e usado, o chamado teste de causalidade de Sims. Ele sera 
discutido atraves de um exercfcio. 

55 KOOP, Cary. Analysis of economic data. Nova York: John Wiley & Sons, 2000. p. 1 75. 
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Essa e a ideia aproximada do chamado teste de causalidade de Granger. 56 Mas deve-se observar 
que a questao da causalidade e profundamente filosofica, com todos os tipos de contra versias. Em urn 
extremo estao as pessoas que acreditam que “tudo tenha uma causa”, e no outro estao aquelas que ne- 
gam a existencia de causagao, seja qual for. 57 O econometrista Edward Learner prefere o termo prece¬ 
dence a causalidade. Francis Diebold prefere o termo causalidade preditiva. Como ele escreve: 

[. ..] a afirmagao “y ; causa yj" e uma abreviagao da afirmagao mais exata, porem mais longa: “y, contem 
informagoes uteis para prever y. (no sentido dos mmirnos quadrados lineares), acima e alem das historias 
passadas das outras variaveis no sistema”. Pai'a poupar espago, dizemos simplesmente que y t causa y.-. 58 


O teste de Granger 

Para explicar o teste de Granger, consideraremos a pergunta feita com frequencia em macroeco- 
nomia: sera o PIB que “causa” a oferta de moeda M (PIB -> M) ou sera a oferta de moeda M que 
causa o PIB (M —»■ PIB)? (em que a seta aponta para a diregao da causalidade). O teste da causalida¬ 
de de Granger pressupoe que as informagoes relevantes a previsao das respectivas variaveis prediti- 
vas, PIB e M, estao contidas unicamente nos dados de serie temporal dessas variaveis. O teste 
envolve a estimagao do seguinte par de regressoes: 


n n 


PIB, = 

/= 1 

i + y.PjWBt-j + u u 

7=1 

(17.14.1) 

n 

M, = 

i= 1 

n 

+ ^ ^ 8j PIB f- j + U2t 

7=1 

(17.14.2) 


Em que se supoe que os termos de erro u h e u 2 , nao estejam correlacionados. A proposito, observe 
que, uma vez que temos duas variaveis, estamos lidando com a causalidade bilateral. Nos capftulos 
sobre series temporais econometricas, estenderemos isso a causalidade multivariada atraves da tecni- 

ca de vetores autorregressivos (VAR). 

A Equagao (17.14.1) postula que o PIB corrente esteja relacionado a seus proprios valores passa- 
dos, bem como aqueles de M, e a Equagao (17.14.2) postula um comportamento semelhante para M. 
Note que essas regressoes podem ser expressas em forma de crescimento, PIB e M, em que o ponto 
sobre a variavel indica sua taxa de crescimento. Agora distinguimos quatro casos: 

1. Uma causalidade unidirecional de M para PIB sera indicada se os coeficientes estimados das 
defasagens de M na Equagao (17.14.1) forem estatisticamente diferentes de zero como grupo e o 
conjunto de coeficientes estimados do PIB na Equagao (17.14.2) nao for estatisticamente dife- 
rente de zero. 

2. Por outro lado, a causalidade unidirecional do PIB a M existe se o conjunto de coeficientes de- 
fasados na Equagao (17.14.1) nao e estatisticamente diferente de zero e o conjunto dos coefi¬ 
cientes do PIB na Equagao (17.14.2) e estatisticamente diferente de zero. 

3. Feedback, ou causalidade bilateral, sera sugerido quando os conjuntos de coeficientes de M e 
PIB forem estatisticamente diferentes de zero em ambas as regressoes. 


56 GRANGER, C. W. ). "Investigating causal relations by econometric models and cross-spectral methods". 
Econometrica, p. 424-438, jul. 1969. Embora seja popularmente conhecido como teste de causalidade de Gran¬ 
ger, e adequado chama-lo de teste de causalidade de Wiener-Granger, pois anteriormente foi sugerido 
por Wiener. Veja Wiener, N. "The theory of prediction". In: BECKENBACK, E. F. (Ed.). Modern mathematics for 
engineers. Nova York: McGraw-Hill, 1956. p. 165-190. 

57 Para uma excelente discussao desse topico, veja ZELLNER, Arnold. "Causality and econometrics". Carnegie- 
-Rochester Conference Series, 10. BRUNNER, K.; MELTZER, A. H. (Eds.). Amsterda: North Holland Publishing 
Company, 1979. p. 9-50. 

58 DIEBOLD, Francis X. Elements of forecasting. 2. ed. South Western Publishing, 2001. p. 254. 
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4. Porfim, a independence sera sugerida quando osconjuntos de coeficientes deMe PIB naoforem 
estatisticamente significativos em nenhuma das regressoes. 

Em termos mais gerais, uma vez que o future nao pode prever o passado, se a variavel X (Granger) 
causa a variavel Y, varia 5 des em X deveriam preceder varia 5 oes em Y. Portanto, em uma regressao de 
Y sobre outras variaveis (incluindo seus proprios valores passados), se incluirmos os valores passados 
ou defasados de X e ele aprimorar significativamente a previsao de Y, poderemos dizer que X (Granger) 
causa Y. Uma definigao similar aplica-se se Y (Granger) causa X. 

Seguem as etapas envolvidas na implementagao do teste de causalidade de Granger, que serao 
ilustradas com o exemplo de PIB-moeda dado na Equa£ao (17.14.1); 


1. Calcule a regressao do PIB corrente contra todos os termos do PIB defasados e outras variaveis, 
se houver, mas nao inclua as defasagens de M nessa regressao. Como foi feito no Capitulo 8, esta 
e a regressao restrita. Dessa regressao obtemos a soma dos quadrados dos reslduos, SQR fi . 

2. Agora efetue a regressao incluindo os termos de M defasados. Na terminologia do Capitulo 8, esta 
e a regressao irrestrita. Dessa regressao, obtemos a soma de quadrados dos reslduos irrestritos, 

SQR m . 

3. A hipotese nula e H 0 : a, = 0, i — 1, 2,. .., n, ou seja, os termos de M defasados nao pertencem a 
regressao. 

4. Para testar essa hipotese, aplicamos o teste F dado pela Equagao (8.7.9), a saber. 


(RSS^ - RSSur)/w 
RSS ur /(h - k) 


(8.7.9) 


que segue a distribui§ao F com m e (n — k) graus de liberdade. No presente caso, m e igual ao 
numero de defasagens de M e k e o numero de parametros estimados na regressao irrestrita. 

5. Se o valor calculado de F for maior que o valor crltico de F ao nivel de significancia escolhido, 
rejeitaremos a hipotese nula, e nesse caso os termos de defasagens de M pertencerao a regressao. 
Essa e outra forma de dizer que M causa o PIB. 

6 . Asetapasde 1 a 5 podem serrepetidas para testar o modelo (17.14.2), ou seja, se a varia^ao do PIB 
causa a de M. 

Antes de ilustrarmos o teste de causalidade de Granger, ha varias observa£oes que precisam ser 
feitas: 


1. Supoe-se que as duas variaveis, PIB e M, sejam estaciondrias. Discutimos o conceito de estacio- 
nariedade em termos intuitivos anteriormente e ele sera discutido mais formalmente no Capitulo 
21 . As vezes, tirar as primeiras difcrcncas das variaveis torna-as estacionarias, seja nao forem 
estacionarias em nivel. 

2. O numero de defasagens a ser introduzido nos testes de causalidade e uma questao pratica impor- 
tante. Como no caso dos modelos de defasagens distribuidas, pode ser preciso usar o criterio de 
informacdo de Akaike ou Schwarz para fazer a escolha. Mas deve ser acrescentado que a diregao 
da causalidade pode depender do numero de termos defasados incluidos. 

3. Supusemos que os termos de erro que entram no teste de causalidade nao estao correlacionados. 
Se nao for esse o caso, podemos fazer a transforma 5 ao adequada como visto no Capitulo 12. 59 

4. Uma vez que nosso interesse e testar a causalidade, nao e preciso apresentar os coeficientes esti¬ 
mados dos modelos (17.14.1) e (17.14.2) explicitamente (para poupar espa 5 o); apenas os resulta- 
dos do teste F dado na Equagao (8.7.9) bastarao. 

5. E preciso prevenir-se contra a causalidade “espiiria”. Em nosso exemplo de PIB-M, suponha que seja 
considerada a taxa de juros, por exemplo, a taxa de juros de curto prazo. E bem possivel que a moeda 

59 Para mais detalhes, veja CHAREMZA, Wojciech W.; DEADMAN, Derek F. New directions in econometric practice: 
general to specific modelling, cointegration and vector autoregression. 3. ed. Edward Elgar Publishing, 1997. 
capitulo 6. 
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seja a “causa”da taxa de juros (no sentido de Granger), e esta, por sua vez, “cause” o PIB. Por- 
tanto, se nao considerarmos a taxa de juros, e constatarmos que e a moeda que causa o PIB, a 
causalidade observada entre o PIB e a moeda pode ser espuria. 60 Como observado, uma maneira 
de lidar com isso e considerar um sistema de varias equa£6es, como vetores autorregressivos 
(VAR), que discutiremos em detalhes no Capftulo 22. 


EXEMPLO 17.12 

Causalidade entre 
moeda e renda 


R. W. Hafer usou o teste de Granger para descobrir a natureza da causalidade entre o PNB 
(e nao o PIB) e M nos Estados Unidos, para o perfodo que vai do primeiro trimestre de 1960 
ate o quarto trimestre de 1980. Em vez de usar os valores brutos dessas variaveis, utilizou as 
taxas de crescimento delas, PNB e M, e usou quatro defasagens de cada uma das variaveis 
das duas regressoes apresentadas anteriormente. Os resultados foram os seguintes: 61 a hipo- 
tese nula em cada caso e que a variavel considerada nao "causa", no sentido de Granger, a 
outra variavel. 


Dire^ao da causalidade Valor de F Decisao 

M —>■ PNB 2,68 Rejeitar 

PNB —> M 0,56 Nao rejeitar 


Esses resultados sugerem que a dire^ao da causalidade e da variafao da moeda para a varia- 
fao do PNB, ja que o Festimado e significativo no nfvel de 5%, o valor critico de Fe 2,50 (para 
4 e 71 graus de liberdade). Por outro lado, nao ha "causag:ao reversa" da varia^ao do PNB para 
a da moeda, ja que o valor de Fe insignificante. 


EXEMPLO 17.13 

Causalidade entre 
moeda e taxa de 
juros no Canada 


Consulte os dados da Tabela 1 7.5 sobre o Canada. Suponha que desejemos verificar se 
existe causalidade entre a oferta de moeda e a taxa de juros no Canada para os perfodos tri- 
mestrais de 1979-1988. Para mostrar que o teste de causalidade de Granger depende funda- 
mentalmente do numero de termos defasados introduzidos no modelos, apresentamos a 
seguir os resultados do teste Fusando varias defasagens (trimestrais). Em cada caso, a hipo- 
tese nula e de que a taxa de juros nao causa (no sentido de Granger) varia^ao na oferta de 
moeda e vice-versa. 


Dire^ao de causalidade 

Numero de defasagem Valor de F 

Decisao 

R^ M 

2 

12,92 

Rejeitar 

M —> R 

2 

3,22 

Rejeitar 

R^ M 

4 

5,59 

Rejeitar 

M-> R 

4 

2,45 

Rejeitar (a 7%) 

Rh> M 

6 

3,5163 

Rejeitar 

R 

6 

2,71 

Rejeitar 

R^ M 

8 

1,40 

Nao rejeitar 

M -> R 

8 

1,62 

Nao rejeitar 


Note estes aspectos dos resultados anteriores do teste F: ate seis defasagens, ha causalida¬ 
de bilateral entre a oferta de moeda e a taxa de juros. Entretanto, com oito defasagens, nao 
ha relag:ao estatisticamente discernfvel entre as duas variaveis. Isso reforga o ponto ressaltado 
anteriormente de que o resultado do teste de Granger e sensfvel ao numero de defasagens 
introduzidas no modelo 


60 Sobre esse assunto, veja J. H. STOCK, J. H.; WATSON, M. W. "Interpreting the evidence on money-income 
causality", journal of Econometrics, 1989. v. 40, p. 783-820. 

61 HAFER, R. W. "The role of fiscal policy in the St. Louis equation". Review, Federal Reserve Bank of St. Louis, 
p. 1 7-22, jan 1982. Veja a nota de rodape 12 para detalhes do procedimento. 
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EXEMPLO 17.14 

Causalidade entre 
a taxa de 
crescimento do 
PIB e a taxa de 
poupanga bruta 
em nove paises do 
Leste Asiatico 


Um estudo da causalidade bilateral entre a taxa de crescimento do PIB ( g ) e a taxa de 
poupanga bruta (s) mostrou os resultados apresentados na Tabela 1 7.9. 62 Por comparagao, 
os resultados para os Estados Unidos tambem sao apresentados na tabela. De modo geral, os 
resultados da Tabela 1 7.9 mostram que, para a maioria dos pafses do Leste Asiatico, a causa¬ 
lidade vai da taxa de crescimento do PIB a taxa de poupanga bruta. Em contrapartida, para 
os Estados Unidos, para o perfodo de 1950-1988 ate a defasagem 3, a causalidade foi em 
ambas as diregoes, mas para as defasagens 4 e 5 ela foi da taxa de crescimento do PIB ate a 
taxa de poupanga, mas nao na diregao oposta. 


TABELA 17.9 

Testes de 
causalidade 
bivariada de Granger 
entre a taxa de 
crescimento real do 
PIB per capita e a 
taxa de poupanga 
bruta 

Fonte: World Bank, The East 
Asian miracle: economic 
growth and public policy. 
Nova York: Oxford 
University Press, 1993, p. 
244, (Tabela A5-2). A fonte 
original e SUMMERS, 
Robert; HESTON, Alan. 
“The Penn world tables 
(mark 5): an expanded set of 
international comparisons, 
1950-88”. Quarterly 
Journal of Economics, v. 

105, n. 2,1991. 


Poupan^as variaveis Poupan^as variaveis 

Economia, Anos de com defasagem Economia, Anos de com defasagem 

anos defasagem do lado direito Crescimento anos defasagem do lado direito Crescimento 


Hong Kong, 

1 

Sig 

Sig 

Filipinas 

1 

NS 

Sig 

1960-88 

2 

Sig 

Sig 

1950-88 

2 

NS 

Sig 


3 

Sig 

Sig 


3 

NS 

Sig 


4 

Sig 

Sig 


4 

NS 

Sig 


5 

Sig 

Sig 


5 

NS 

Sig 

Indonesia, 

i 

Sig 

Sig 

Cingapura 

1 

NS 

NS 

1965 

2 

NS 

Sig 

1960-88 

2 

NS 

NS 


3 

NS 

Sig 


3 

NS 

NS 


4 

NS 

Sig 


4 

Sig 

NS 


5 

NS 

Sig 


5 

Sig 

NS 

Japao, 

1 

NS 

Sig 

Taiwan, China, 

1 

Sig 

Sig 

1950-88 

2 

NS 

Sig 

1950-88 

2 

NS 

Sig 


3 

NS 

Sig 


3 

NS 

Sig 


4 

NS 

Sig 


4 

NS 

Sig 


5 

NS 

Sig 


5 

NS 

Sig 

Coreia, Rep. of, 

1 

Sig 

Sig 

Tailandia, 

1 

NS 

Sig 

1955-88 

2 

NS 

Sig 

1950-88 

2 

NS 

Sig 


3 

NS 

Sig 


3 

NS 

Sig 


4 

NS 

Sig 


4 

NS 

Sig 


5 

NS 

Sig 


5 

NS 

Sig 

Malasia, 

1 

Sig 

Sig 

Estados Unidos, 

1 

Sig 

Sig 

1955-88 

2 

Sig 

Sig 

1950-88 

2 

Sig 

Sig 


3 

NS 

NS 


3 

Sig 

Sig 


4 

NS 

NS 


4 

NS 

Sig 


5 

NS 

Sig 


5 

NS 

Sig 


Sig: significativa; NS: nao significativa. 

Observe: o crescimento e o crescimento do PIB real per capita a pregos internacionais de 1985. 


Para concluir nossa discussao sobre a causalidade de Granger, lembre-se de que a questao 
que estamos examinando e se estatisticamente podemos detectar a diregao da causalidade 
quando temporalmente ha uma relagao de lead-lag entre duas variaveis. Se a causalidade for 
estabelecida, ela sugerira que se pode usar uma variavel para prever melhor a outra, em vez 
de simplesmente considerar a historia pregressa dessa outra variavel. No caso das economias 
do Leste Asiatico, parece que podemos prever melhor a poupanga bruta considerando os 
valores defasados da taxa de crescimento do PIB em vez de considerar apenas os valores 
defasados da taxa de poupanga bruta. 


*Uma observagao sobre causalidade e exogeneidade 

Como estudaremos nos capitulos sobre modelos de equagao simultanea na Parte 4, as variaveis 
economicas sao classificadas com frequencia em duas categorias amplas, endogena e exogena. Em 
termos gerais, as variaveis endogenas sao o equivalente as variaveis X, ou regressores, em tal modelo, 
contanto que as variaveis X nao sejam correlacionadas com o termo de erro naquela equagao. 63 

62 Esses resultados sao obtidos de The East Asian miracle: economic growth and public policy, publicado para o Ban¬ 
co Mundial pela Oxford University Press, 1993, p. 244. 

* Opcional. 

63 Naturalmente, se as variaveis explanatorias incluem um ou mais termos defasados da variavel endogena, esse 
requisito pode nao ser preenchido. 
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Resumo e 
conclusoes 


Agora levantamos uma questao interessante: suponha que em um teste de causalidade de Granger 
verifiquemos que uma variavel X cause (pelo metodo de Granger) uma variavel Y sem ser causada por 
esta (isto e, nao ha causalidade bilateral). Podemos entao tratar a variavel X como exogena? Em ou- 
tras palavras, podemos usar a causalidade de Granger (ou a nao causalidade) para estabelecer a exo- 
geneidade? 

Para respondermos a essa questao, precisamos distinguir tres tipos de exogeneidade: (1) fraca, (2) 
forte e (3) super. Para manter a exposiijao simples, suponha que consideremos apenas duas variaveis, 
Y t e X„ e suponha ainda que efetuemos a regressao de Y, contra X,. Diremos que X, efracamente exo- 
geno se Y, tambem nao explicar X,. Nesse caso, a estima§ao e o teste do modelo de regressao podem 
ser feitos, condicionais aos valores de X t . De fato, ao retornar ao Capitulo 2, voce percebera que nos- 
sa modelagem de regressao era condicional aos valores das variaveis X. X, sera fortemente exogeno 
se os valores atual e defasado de Y nao o explicarem (isto e, nao existe rela£ao de feedback). E X, sera 
superexogeno se parametros na regressao de Y contra X nao mudarem mesmo que os valores de X 
mudem; isto e, os valores do parametro nao variam a mudan^as no(s) valor(es) de X. Se esse for o 
caso, a famosa “crftica de Lucas” pode perder sua for£a. 64 

A razao para distinguir entre os tres tipos de exogeneidade e que: “Em geral, a fraca exogeneida¬ 
de e tudo o que precisamos para estimar e testar; a exogeneidade forte e necessaria para prever e a 
superexogeneidade para analise de polfticas”. 65 

Retornando a causalidade de Granger, se uma variavel, por exemplo, Y, nao causa outra variavel, 
por exemplo X, podemos supor que esta ultima seja exogena? Infelizmente, a resposta e nao. Se esta- 
mos falando de exogeneidade fraca, podemos mostrar que a causalidade de Granger nao e nem ne¬ 
cessaria nem suficiente para estabelecer a exogeneidade. Por outro lado, a causalidade de Granger e 
necessaria (mas nao suficiente) para a exogeneidade forte. As demonstra 5 oes desses enunciados vao 
alem do escopo deste livro. 66 Para nossos objetivos, e melhor manter os conceitos de causalidade e 
exogeneidade de Granger separados e tratar o primeiro como uma ferramenta descritiva, util, para da¬ 
dos de series temporais. No Capitulo 19 discutiremos um teste que pode ser usado para verificar se uma 
variavel pode ser tratada como exogena. 


1. Por razoes psicologicas, tecnologicas e institucionais, um regressando pode responder a um re¬ 
gressor com uma defasagem de tempo. Os modelos de regressao que levam em conta defasagens 
de tempo sao conhecidos como modelos de regressao dinamicos com defasagens. 

2. Existem dois tipos de modelo com defasagens: com defasagens distribufdas e autorregressivo. 
No primeiro, os valores atual e com defasagens dos regressores sao variaveis explanatorias. No 
segundo, os valores com defasagens do regressando aparecem como variaveis explanatorias. 

3. Um modelo de defasagens distribufdas puro pode ser estimado por MQO, mas no caso ha o pro- 
blema de multicolinearidade uma vez que valores defasados sucessivos de um regressor tendem 
a estar correlacionados. 

4. Como resultado, alguns metodos praticos foram elaborados. Estes incluem o modelo de Koyck, o 
de expectativas adaptativas e o mecanismo de ajustes parciais, sendo o primeiro uma abordagem 
puramente algebrica e o segundo, baseado em princfpios economicos. 


64 Robert Lucas, Premio Nobel, apresenta a proposicao de que relafoes existentes entre variaveis economicas 
podem mudar quando a politica muda, e nesse caso os parametros estimados de um modelo de regressao serao 
de pouca valia para previsao. Sobre isso, veja BLANCHARD, Oliver. Macroeconomics. Prentice Hall, 1997, p. 
371-372. 

65 CUTHBERTSON, Keith; HALL, Stephen G.; TAYLOR, Mark P. Applied econometric techniques. University of 
Michigan Press, 1992, p. 100. 

66 Para uma discussao comparativamente simples, veja MADDALA, G. S. introduction to econometrics. 2. ed. Nova York: 
Macmillan, 1992, p. 394-395 e tambem HENDRY, David F. Dynamic econometrics, Nova York: Oxford University 
Press, 1995, Capftulo 5. 
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EXERCICIOS 


5. Um aspecto singular dos modelos de Koyck, de expectativas adaptativas e de ajuste parcial e 

que todos tem natureza autorregressiva, no sentido de que os valores defasados do regressando 
aparecem como uma das variaveis explanatorias. 

6 . A autorregressividade impoe desafios a estima 9 ao; se o regressando defasado esta correlacionado 
com o termo de erro, os estimadores de MQO de tais modelos sao nao apenas tendenciosos, mas 
tambem inconsistentes. Vies e inconsistencia sao o caso dos modelos de Koyck e de expectativas 
adaptativas; o modelo de ajuste parcial e diferente no sentido de que pode ser estimado consis- 
tentemente pelos MQO, apesar da presen 9 a do regressando defasado. 

7. Para estimar os modelos de Kovck e de expectativas adaptativas. o metodo mais popular e o da 

variavel instrumental. Esta e uma variavel proxy para o regressando defasado. mas com a nro- 

priedade de que nao esta correlacionada ao termo do erro. 

8 . Uma alternativa aos modelos de regressao que acabamos de discutir e o modelo polinomial com 
defasagens distribuidas de Almon, que evita os problemas de estima 9 ao associados aos modelos 
autorregressivos. O principal problema com a abordagem de Almon, no entanto, e que tanto a du- 
raqiao da defasagem quanto o grau do polinomio devem ser especificados previamente. Ha metodos 
formais e informais para resolver a opcao da dura^ao da defasagem e o grau do polinomio. 

9. Apesar dos problemas de estima 9 ao que podem acumular-se, os modelos de distribu^ao de de¬ 
fasagens e de autorregressao tem mostrado-se extremamente uteis em economia aplicada, porque 
tomam a teoria economica dinamica, ao levarem em conta explicitamente o papel do tempo. Tais 
modelos ajudam a distinguir, a curto e longo prazo, as rea 9 oes das variaveis dependentes a uma 
varia?ao unitaria no valor das variaveis explanatorias. Assim, esses modelos tem mostrado-se 
uteis para estimar a elasticidade-preco, renda, de substitute e outras, a curto e a longo prazo. 67 

10. Devido as defasagens envolvidas, os modelos autorregressivo e/ou de defasagens distribuidas 
levantam a questao da causalidade em variaveis economicas. No trabalho aplicado, a modelagem da 
causalidade de Granger tem recebido aten 9 ao consideravel. Porem, e preciso ter cautela para usar a 
metodologia de Granger, porque e muito sensfvel a dura 9 ao da defasagem usada no modelo. 

11. Mesmo que uma variavel (V) “cause, pelo metodo de Granger” outra variavel ( Y ), isso nao significa 
que X seja exogeno. Distinguimos tres tipos de exogeneidade — fraca, forte e super — e aponta- 
mos a importancia da distin 9 ao. 


17.1. Explique de maneira breve se as seguintes afirma 9 oes sao verdadeiras, falsas ou incertas: 

a. Todos os modelos econometricos sao essencialmente dinamicos. 

b. O modelo de Koyck nao fara tanto sentido se alguns coeficientes das defasagens distribui¬ 
das forem positivos e alguns forem negativos. 

c. Se os modelos de expectativas adaptativas e o de Koyck forem estimados por MQO, os 
estimadores serao tendenciosos, mas consistentes. 

d. No modelo de ajuste parcial, os estimadores de MQO sao tendenciosos em amostras infinitas. 

e. Na presen 9 a de regressores estocasticos e de um termo de erro autocorrelacionado, o 
metodo de variaveis instrumentais produzira estimativas nao tendenciosas, bem como 
consistentes. 

f. Na presen 9 a de um regressando defasado como regressor, a estatfstica d de Durbin-Watson 
para detectar autocorrela 9 ao e praticamente inutil. 

g. O teste h de Durbin e valido tanto em amostras grandes quanto pequenas. 

Ii. O teste de Granger e um teste de precedencia e nao de causalidade. 


67 Para aplicagoes desses modelos, veja HARBERGER, Arnold C. (Ed.). The demand for durable goods. Chicago: 
University of Chicago Press, 1960. 
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17.2. Deduza a Equa£ao (17.7.2). 

17.3. Demonstre a Equa£ao (17.8.3). 

17.4. Suponha que os pre£os sejam formados de acordo com a seguinte hipotese de expectativas 
adaptativas: 

p; = yp,- t + (1 - Y)Plx 
em que P* to preco esperado t P to preco real. 

Complete a tabela a seguir, supondo que y — 0,5: r 


Periodo 

p* 

P 

t- 3 

100 

no 

t-2 


125 

t- 1 


155 

t 


185 

t+ 1 


— 


17.5. Considere o modelo 

Y, = a + P\X\ t + f$ 2 X 2 t + Y t - i + v, 

Suponha que Y t _ 1 t v, sejam correlacionados. Para eliminar a correla^ao, suponha que seja 
usada a seguinte abordagem da variavel instrumental: primeiro efetue a regressao de Y, contra 
X\ t e X 2t t obtenha o Y, estimado dessa regressao. Entao efetue a regressao de 

Y, - a + P\X\ t + p 2 X 2t + PsYt-i + v, 
em que Y t _ l sao estimados da regressao de primeira ordem. 

a. Como esse procedimento remove a correla£ao entre Y ,_, e v, no modelo original? 

b. Quais as vantagens do procedimento recomendado em rela§ao a abordagem de Liviatan? 
f 17.6. a. Escreva (17.4.8). 

b. Avalie a defasagem media para X = 0,2, 0,4, 0,6, 0,8. 

c. Ha alguma relayao sistematica entre o valor de X e o valor da defasagem media? 

17.7. a. Prove que para o modelo de Koyck, a defasagem media e a apresentada na Equac^ao 

(17.4.10). 

b. Se X for relativamente grande, quais suas implicayoes? 

17.8. Usando a formula para a defasagem media dada na Equacjao (17.4.9), verifique a defasagem 
media de 10,959 trimestres relatados no exemplo da Tabela 17.1. 

17.9. Suponha 

M t = a + P\Y t + f3 2 R t + u t 

em que M — demanda por saldos reais, Y* — renda real esperada e R* — taxa de juros espera- 
da. Suponha que as expectativas sejam formuladas como se segue: 

Y;= y l Y t + (1- y x )Yl l 

R*t - nRt + (1 - Yi)RU 

em que Yi e Yi sao coeficientes de expectativa, ambos situados entre 0 e 1. 

a. Como poderfamos expressar M, em termos das quantidades observaveis? 

b. Que problemas de estima 5 ao voce preve? 


*Adaptado de SHAW, C. K. op. cit., p. 26. 
fOpcional. 
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*17.10. Se voce estima a Equapao (17.7.2) pelos MQO, pode derivar estimativas dos parametros 
originals? Que problemas voce preve? (Para detalhes, veja Roger N. Waud.) 

17.11. Modelo de correlagao serial. Considere o seguinte modelo: 


Y, = a + fX t + u t 


Suponha que u, siga o esquema de autorregressao de primeira ordem de Markov apresentado 
no Capitulo 12, a saber. 


u, = pu ,-1 + s t 


em que p e o coeficiente de autocorrelapao (de primeira ordem) e onde e, satisfaz todos os 
pressupostos do MQO classico. Entao, como mostrado no Capitulo 12, o modelo 


Y, = a(l — p) + P(X, - pX t - 1) + pY ,-1 + e, 


tera um termo de erro serialmente independente, tornando possrvel a estimagao por MQO. 
Mas esse modelo de correlagao serial, como e chamado, parece muito com de Koyck e com 
os modelos de expectativas adaptativas e de ajustamento parcial. Como saberfamos, em qual- 


quer situa§ao, qual dos modelos precedentes e adequado? 1 


17.12. Considere o modelo de Koyck (ou, no caso, das expectativas adaptativas) dado na Equapao 
(17.4.7), a saber. 


Yi — o;(l — 7.) + fioXt + /. Yi i + (ip ~ hut- 1 ) 


Suponha no modelo original que u, siga o esquema de autorregressao de primeira ordem u t 
— pu x _ t — £,, em que p e o coeficiente de autocorrelapao e s, satisfaz todos os pressupostos 
classicos de MQO. 

a. Se p = X, o modelo de Koyck pode ser estimado por MQO? 

b. As estimativas assim obtidas nao serao tendenciosas? Consistentes? Por que? 

c. Em que medida e razoavel supor que p — 7,? 

17.13. Modelo de defasagens distribuidas triangular ou aritmetico} Este modelo supoe que o esti- 
mulo (variavel explanatoria) exerca seu maior impacto no atual periodo de tempo e entao 
diminua em decrescimos de mesma magnitude, a medida que se entra no passado distante. 
Geometricamente, ele e apresentado na Figura 17.9. Seguindo essa distribuiyao, suponha que 
a seguinte sucessao de regressoes seja efetuada: 



2X, + 2X,- } + Xf-2 

6 


Y t = a + f 



etc., e escolha a regressao que da o R 2 mais alto como a “melhor” regressao. Comente essa 
estrategia. 


‘"Misspecification in the 'partial adjustment' and 'adaptive expectations' models". International Economic Review, 
jun. 1968. v. 9, n. 2, p. 204-217. 

fPara uma discussao do modelo de correlapao serial, veja GRILICHES, Zvi. "Distributed lags: a survey". 
Econometrica, jan. 1967. v. 35, n. 1°, p. 34. 

ifEste modelo foi proposto por FISHER, Irving. "Note on a short-cut method for calculating distributed lags". In¬ 
ternational Statistical Bulletin, 1937, p. 323-328. 
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FIGURA 17.9 

Esquema de 
defasagem triangular 
ou aritmetico 
(de Fisher). 


17.14. Dos dados trimestrais para o periodo de 1950-1960, F. P. R. Brechling obteve a seguinte 
fungao de demanda de mao de obra, para a economia inglesa (os dados entre parenteses sao 
os erros padrao): 

£= 14,22 + 0,1720,- 0,028?- 0,0007^- 0,297£j_, 

(2,61) (0,014) (0,015) (0,0002) (0,033) 

R 2 - 0,76 1,37 

em que E — {E, — E t _, ) 

Q — produgao 
t — tempo 

A equagao anterior baseou-se no pressuposto de que o nlvel desejado de emprego E* e uma 
fungao da produgao, do tempo e do tempo elevado ao quadrado, e sob a hipotese de que E, — 
E t _ x = 8{E* — E t _ |) em que 8, o coeficiente de ajustamento, situa-se entre 0 e 1. 

a. Interprete a regressao anterior. 

b. Qual o valor de 81 

c. Derive a fungao de demanda a longo prazo para a mao de obra por meio da fungao de 
demanda estimada a curto prazo. 

d. Como se poderia testar a correlagao serial no modelo anterior? 

17.15. Ao estudar a demanda de uma fazenda por tratores, Griliches usou o seguinte modelo: 1 

T* - Y 

em que T* — estoque desejado de tratores 
X x = prego relativo de tratores 
X 2 = taxa de juros 

Usando o modelo de ajuste de estoque, ele obteve os seguintes resultados para o periodo de 
1921-1957: 

log7)= constante - 0,218 log X\ t -\ - 0,855 log X 2 j~\ + 0,864 log 7j_i 
(0,051) (0,170) (0,035) 

R 2 = 0,987 

em que os dados entre parenteses sao os erros padrao estimados. 

* BRECHLING, F. P. R. "The relationship between output and employment in British manufacturing industries". 
Review of Economic Studies, v. 32, jul. 1965. 

* GRILICHES, Zvi. "The demand for a durable input: farm tractors in the United States, 1921-1957". In: HARBERGER, 
Arnold C. (Ed.). The demand for durable goods. Chicago: University of Chicago Press, 1960. 


Pk 



0 
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a. Qual o coeficiente estimado de ajustamento? 

b. Quais as elasticidades-pre^o de curto e longo prazo? 

c. Quais as elasticidades-juros correspondentes? 

d. Quais as razoes para as taxas alta e baixa de ajustamento neste modelo? 

17.16. Sempre que a variavel dependente defasada aparece como variavel explanatoria, o R 2 em 
geral e muito mais alto que em situates em que ela nao e incluida. Quais as razoes para essa 
observagao? 

17.17. Considere os padroes de defasagem na Figura 17.10. Que graus de polinomio se ajustariam 
as estruturas de defasagens e por que? 


FIGURA 17.10 

Estruturas de 

defasagens 

hipoteticas. 
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17.18. Considere a Equa?ao (17.13.4): 

Pi = ao + a\i 4- aii 2 H-1- a m i m 

Para obter a variancia de /3, das variancias de a h usamos a seguinte formula: 
var(/3,j = var(do +dii 2 + • • • + a m i m ) 


= i 2j var(aj) + 2 jC +p ) C ov (djd p ) 

j =o j<p 

a. Usando a formula anterior, encontre a variancia de P, expressa como 

Pi -do + d\i + dii 2 
Pi =«o + d\i + dji 2 + dji 2 

b. Se as variancias de a, sao grandes, em rela 9 ao a si mesmas, a variancia de P, tambem sera 
grande? Por que? 
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17.19. Considere o seguinte modelo de distribuic^ao de defasagens: 

Y, = a + ft 0 X t + \ + fcXt-i + 3 + faXt- 4 + Mr 


Suponha que ft, possa ser expresso adequadamente pelo polinomio de segundo grau, como se 
segue: 


I, = a o + aft + aft 1 


Como voce estimaria os ft se queremos impor a restri£ao de que ft 0 — /i 4 = 0 

17.20. Modelo de defasagens distribuidas em forma de V invertido. Considere o modelo de defasa¬ 
gens distribuidas finito, para o periodo k 


Y t - a + foX t + f\X t -1 + fi^t-2 + • • ■ + PkXt-k + u t 


F. DeLeeuw propos a estrutura para os f> como na Figura 17.11, em que os ft seguem a forma 
de V invertido. Supondo, para simplificar, que k (a dura§ao maxima da defasagem) seja um 
numero par e pressupondo ainda que ft 0 e ft k sejam zero, DeLeeuw sugere o seguinte esque- 


ma para os ft: 



{k- i)ft 


Como o esquema de DeLeeuw poderia ser usado para estimar os parametros do modelo an¬ 
terior com defasagens distribuidas para o periodo kl 


FIGURA 17.11 

Modelo V de 

defasagens 

distribuidas 



0 12 3 


Defasagem 


17.21. Retome ao Exerclcio 12.15. Uma vez que o valor d mostrado la e de pouca utilidade para 
detectar a autocorrclagao (de primeira ordem) (por que?), como voce testaria a autocorrela- 
5 ao nesse caso? 

Exercfcios aplicados 

17.22. Considere o modelo a seguir: 


Y* = a + ft 0 X t + u t 


* Veja o artigo dele, "The demand for capital goods by manufacturers: a study of quarterly time series". Econometrica, 
jul. 1962. vol. 30, n. 3, p. 407-423. 
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em que Y* — desejado, ou despesa desejada, ou de longo prazo, para a nova fabrica e equipa- 
mento, X, — vendas e t — tempo. Usando o modelo de ajustamento de estoque, estime os para- 
metros da funqao de demanda de curto e longo prazos para os gastos em nova fabrica e 
equipamento dados na Tabela 17.10. 

Como poderlamos verificar se ha correla 5 ao serial nos dados? 


TABELA 17.10 

Investimento na fabrica 

Ano 

Despesas com 
a fabrica 

Vendas Y,X 2 

Ano 

Despesas com 
a fabrica 

Vendas Y, X 2 

e nos equipamentos na 

1970 

36,99 

52,805 

1981 

128,68 

168,129 

manufatura Y e vendas 

1971 

33,60 

55,906 

1982 

123,97 

163,351 

de produtos 

1972 

35,42 

63,027 

1983 

117,35 

172,547 

manufaturados X 2 em 

1973 

42,35 

72,931 

1984 

139,61 

190,682 

bilhoes de dolares, 

1974 

52,48 

84,790 

1985 

152,88 

194,538 

ajustados sazonalmente 

1975 

53,66 

86,589 

1986 

137,95 

194,657 

para os Estados Unidos, 

1976 

58,53 

98,797 

1987 

141,06 

206,326 

referentes ao periodo 

1977 

67,48 

113,201 

1988 

163,45 

223,541 

1970-1991 

1978 

78,13 

126,905 

1989 

183,80 

232,724 

Fonte: Economic Report of the 

1979 

95,13 

143,936 

1990 

192,61 

239,459 

President, 1993. Dados sobre Y 

1980 

112,60 

154,391 

1991 

182,81 

235,142 


da Tabela B-52, p. 407; dados 
sobre X 2 da Tabela 8-53, 


17.23. Use os dados do Exercicio 17.22, mas considere o seguinte modelo: 

Y* = foX?'e'“ 

Usando o modelo de ajustamento de estoque (por que?), estime as elasticidades a curto e 
longo prazo dos gastos com a nova fabrica e equipamentos com relagao as vendas. Compare 
os resultados obtidos com aqueles do Exercicio 17.22. Qual modelo voce escolheria e por 
que? Existe correla§ao serial nos dados? Como podemos saber? 

17.24. Use os dados do Exercicio 17.22, mas suponha que 

Yf — oi + fiX t + Uf 

em que 2Qsao vendas desejadas. Estime os parametros deste modelo e compare os resultados 
com aqueles do Exercicio 17.22. Como voce decidiria qual o modelo adequado? Com base 
na estatfstica h, voce concluiria que ha ccrrelagao serial nos dados? 

17.25. Suponha que alguem o convenga de que a relagao entre as despesas com novas instalagoes e 
equipamentos e as vendas sejam as seguintes: 

Y* t = a + fiX* + u t 

em que Pea despesa desejada e X * as vendas desejadas ou esperadas. Use os dados apre- 
sentados no Exercicio 17.22 para estimar esse modelo e comente seus resultados. 

17.26. Usando os dados do Exercicio 17.22, determine se a despesa com a fabrica causa (no sentido 
de Granger) vendas ou se as vendas causam (no sentido de Granger) as despesas com as 
novas instalagoes. Use ate seis defasagens e comente seus resultados. Qual a conclusao im- 
portante que podemos tirar deste exercicio? 

17.27. Suponha que as vendas no Exercicio 17.22 tenham um efeito de desafagens distribmdas so¬ 
bre as despesas com as novas instalagoes e equipamento. Aplique um modelo de defasagens 
de Almon adequado aos dados. 

17.28. Estime novamente a Equagao (17.13.16) impondo (1) uma restrigao quase finita, (2) uma 
restrigao quase infinita e (3) ambas as restrigoes finitas e compare seus resultados dados na 
Equagao (17.13.16). Qual a conlcusao geral que se pode tirar? 
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TABELA 17.11 Investimentos, vendas e taxas de juros, Estados Unidos, 1960-1999 


Observagao 

Investimento 

Vendas 

Juros 

Observagao 

Investimento 

Vendas 

Juros 

1960 

4,9 

60.827 

4,41 

1980 

69,6 

327.233 

11,94 

1961 

5,2 

61.159 

4,35 

1981 

82,4 

355.822 

14,17 

1962 

5,7 

65.662 

4,33 

1982 

88,9 

347.625 

13,79 

1963 

6,5 

68.995 

4,26 

1983 

100,8 

369.286 

12,04 

1964 

7,3 

73.682 

4,40 

1984 

121,7 

410.124 

12,71 

1965 

8,5 

80.283 

4,49 

1985 

130,8 

422.583 

11,37 

1966 

10,6 

87.187 

5,13 

1986 

137,6 

430.419 

9,02 

1967 

11,2 

90.820 

5,51 

1987 

141,9 

457.735 

9,38 

1968 

11,9 

96.685 

6,18 

1988 

155,9 

497.157 

9,71 

1969 

14,6 

105.690 

7,03 

1989 

173,0 

527.039 

9,26 

1970 

16,7 

108.221 

8,04 

1990 

176,1 

545.909 

9,32 

1971 

17,3 

116.895 

7,39 

1991 

181,4 

542.815 

8,77 

1972 

19,3 

131.081 

7,21 

1992 

197,5 

567.1 76 

8,14 

1973 

23,0 

153.677 

7,44 

1993 

215,0 

595.628 

7,22 

1974 

26,8 

177.912 

8,57 

1994 

233,7 

639.163 

7,96 

1975 

28,2 

182.198 

8,83 

1995 

262,0 

684.982 

7,59 

1976 

32,4 

204.150 

8,43 

1996 

287,3 

718.113 

7,37 

1977 

38,6 

229.513 

8,02 

1997 

325,2 

753.445 

7,26 

1978 

48,3 

260.320 

8,73 

1998 

367,4 

779.413 

6,53 

1979 

58,6 

297.701 

9,63 

1999 

433,0 

833.079 

7,04 


Observagdes: Investimento D = investimento fixo privado no processamento de informagoes, equipamento e software, bilhoes de dolares, ajustados sazonalmente. 
vendas no total de produtos fabricados e comercio, milhoes de dolares, ajustados sazonalmente. 

Vendas = classificagao da Moody de titulos de primeira linha, %. 

Fonte: Economic Report of the President, 2001, Tabelas B-18, B-57e B-73. 


17.29. ATabela 17.11 apresenta dados sobre o investimento fixo privado em processamento de in- 
forma 5 oes e equipamento ( Y, em bilhoes de dolares), vendas na fabricagao total e comercio 
( X 2 , em milhoes de dolares), e taxa de juros (X 3 , classificagao da Moody de titulos de primei¬ 
ra linha, %); os dados de Y e X 2 sao ajustados sazonalmente. 

a. Teste a causalidade bilateral entre Y e X 2 , atentando ao numero de defasagens. 

b. Teste a causalidade bilateral entre Y e X 3 , novamente atentando ao numero de defasa¬ 
gens. 

c. Para considerar o efeito das defasagens distribufdas das vendas sobre o investimento, 
suponha que voce decida usar a tecnica de desafagem de Almon. Mostre o modelo esti- 
mado, depois de atentar ao numero de defasagens, bem como ao grau do polinomio. 

17.30. A Tabela 17.12 apresenta dados sobre indices de remuneragao real por hora (Y) e produgao 
por hora ( X 2 ), sendo ambos os Indices de base 1992 = 100, no setor comercial, para a econo- 
mia norte-americana para o perfodo de 1960-1999, bem como a taxa de desemprego (A 3 ) 
para o mesmo perfodo. 

a A remuneragao salarial determina a produtividade da mao de obra ou o inverso? 

b. Desenvolva um modelo adequado para testar sua conjectura em (a), fornecendo os dados 
estatfsticos usuais. 

c. Voce acha que a taxa de desemprego tem algum efeito sobre a remuneragao salarial? Em 
caso afirmativo, como voce consideraria esse fator? Mostre a analise estatistica necessaria. 

17.31. Em um teste da causalidade de Granger, Christopher Sims explora o fato de que o futuro nao 
pode causar o presente. Para decidir se uma variavel Y causa uma variavel X, Sims sugere 
que se estime o seguinte par de equates: 


* SIMS, C. A. "Money, income, and causality". American Economic Review, 1972. v. 62, p. 540-552. 
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i=n i=m i= p 

Yt = + Y.PiXt-j + T, YiYt-i + YMX t+i + u\ t ( 1 ) 

i= 1 i= 1 i= 1 

i—n i=m i= p 

X t - 012 + £>*-, + + £>7 r+i + U2t (2) 

i= 1 i= 1 i= 1 

Estas regressoes incluem os valores defasados, correntes e futures, ou lead, dos regressores; 
termos como X t+l , X t+2 etc., sao chamados de lead ou termos futuros. 

Se Y deve causar X , no sentido de Granger, entao deve haver uma relayao entre Y e os valores 
futuros de X, ou lead. Portanto, em vez de testar se Y.p, = 0, deverfamos igualar o teste 
E/,, = 0 11 a Equa§ao (1) a zero. Se rejeitarmos essa hipotese, a causalidade vai de Y para X, e 
nao de X para Y, porque o future nao pode causar o presente. Comentarios parecidos aplicam-se 
a Equa£ao (2). 

Para efetuarmos o teste de Sims, estimamos a Equagao (1) sem os termos futuros (podemos 
chama-los de regressao restrita) e estimamos a Equa§ao (1) com os termos futuros (chama¬ 
dos de regressao irrestrita). Entao efetuamos o teste F como indicado na Equa 5 ao (8.7.9). Se 
a estatfstica F for significativa (por exemplo, com 5% de probabilidade), concluimos que e o 
Y que causa X, no sentido de Granger. Comentarios semelhantes aplicam-se a Equa^'ao (2). 
Qual teste escolhemos — Granger ou Sims? Podemos aplicar ambos os testes. O unico fator 
favoravel ao teste de Granger e que ele usa menos graus de liberdade, porque ele nao usa os 
termos futuros. Se a amostra nao for suficientemente grande, teremos que usar o teste de 
Sims com cautela. 


TABELA 17.12 

Remuneragao, produtividade 

e taxa de desemprego nos Estados Unidos 

1960- 

1999 


Observafao 

Rem 

PRODUTO 

Taxa DES 

Observafao 

Rem 

PRODUTO 

Taxa DES 

1960 

60,0 

48,8 

5,5 

1980 

89,5 

80,4 

7,1 

1961 

61,8 

50,6 

6,7 

1981 

89,5 

82,0 

7,6 

1962 

63,9 

52,9 

5,5 

1982 

90,9 

81,7 

9,7 

1963 

65,4 

55,0 

5,7 

1983 

91,0 

84,6 

9,6 

1964 

67,9 

57,5 

5,2 

1984 

91,3 

87,0 

7,5 

1965 

69,4 

59,6 

4,5 

1985 

92,7 

88,7 

7,2 

1966 

71,9 

62,0 

3,8 

1986 

95,8 

91,4 

7,0 

1967 

73,8 

63,4 

3,8 

1987 

96,3 

91,9 

6,2 

1968 

76,3 

65,4 

3,6 

1988 

97,3 

93,0 

5,5 

1969 

77,4 

65,7 

3,5 

1989 

95,9 

93,9 

5,3 

1970 

78,9 

67,0 

4,9 

1990 

96,5 

95,2 

5,6 

1971 

80,4 

69,9 

5,9 

1991 

97,5 

96,3 

6,8 

1972 

82,7 

72,2 

5,6 

1992 

100,0 

100,0 

7,5 

1973 

84,5 

74,5 

4,9 

1993 

99,9 

100,5 

6,9 

1974 

83,5 

73,2 

5,6 

1994 

99,7 

101,9 

6,1 

1975 

84,4 

75,8 

8,5 

1995 

99,3 

102,6 

5,6 

1976 

86,8 

78,5 

7,7 

1996 

99,7 

105,4 

5,4 

1977 

87,9 

79,8 

7,1 

1997 

100,4 

107,6 

4,9 

1978 

89,5 

80,7 

6,1 

1998 

104,3 

110,5 

4,5 

1979 

89,7 

80,7 

5,8 

1999 

107,3 

114,0 

4,2 


Notas: REM D = fndice de remunerasao real por hora (1992 D 100). 
PRODUTO = fndice de produ^ao por hora (1992 = 100). 

Taxa de desemprego, %. 

Fonte: Economic Report of the President, 2001, Tabela B-49, p. 332. 


A escolha entre os testes de causalidade de Granger e Sims nao esta clara. Para mais discussoes sobre esses testes, 
veja CHAMBERLAIN, G. "The general equivalence of Granger and Sims causality". Econometrica, 1982. v. 50, 
p. 569-582. 
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Consulte os dados apresentados no Exercicio 12.34. Para fins pedagogicos, aplique o teste de 
causalidade de Sims para determinar se sao as vendas que causam gastos com instalagoes ou 
vice-versa. Use os dados dos quatro ultimos anos como termos futures em sua analise. 
17.32. A Tabela 17.13 apresenta alguns dados macroeconomicos para a economia grega, referentes 
aos anos 1960-1995. 

Considere a seguinte fungao consumo: 

In DCD, = RiP + /I 3 THU + iif 

em que DCD, = despesa de consumo privado desejada real no tempo t; RPD, = renda priva- 
da real dispomvel no tempo f; T.IR, = taxa de juros real no tempo t ; e In representa logaritmo 
natural. 

a. Com base nos dados apresentados na Tabela 17.13, estime a fungao consumo anterior, 
esclarecendo como voce mediu as despesas de consumo privado reais desejadas. 

b. Que problemas econometricos sao encontrados ao estimar a fungao consumo anterior? 
Como eles podem ser resolvidos? Explique detalhadamente. 


TABELA 17.13 





PIB 

f]R 

Ano 

DCD 

RPD 

Grossinv 

Dados 






macroeconomicos 

1960 

107808 

117179 

29121 

145458 

8 

para a economia 
grega 1960-1995 

1961 

115147 

127599 

31476 

161802 

8 

1962 

120050 

135007 

34128 

164674 

8 

1963 

126115 

142128 

35996 

181534 

8,25 

Fonte: SEDDIGHI, H. R.; 

1964 

137192 

159649 

43445 

196586 

9 

LAWLER, K. A.; KATOS, 

A. V. Econometrics: a 

1965 

147707 

172756 

49003 

214922 

9 

practical approach. 

1966 

157687 

182366 

50567 

228040 

9 

Londres: Routledge, 2000, 

1967 

167528 

195611 

49770 

240791 

9 

p. 158. 

1968 

179025 

204470 

60397 

257226 

8,75 


1969 

190089 

222638 

71653 

282168 

8 


1970 

206813 

246819 

70663 

304420 

8 


1971 

217212 

269249 

80558 

327723 

8 


1972 

232312 

297266 

92977 

356886 

8 


1973 

250057 

335522 

100093 

383916 

9 


1974 

251650 

310231 

74500 

369325 

11,83 


1975 

266884 

327521 

74660 

390000 

11,88 


1976 

281066 

350427 

79750 

415491 

11,5 


1977 

293928 

366730 

85950 

431164 

12 


1978 

310640 

390189 

91100 

458675 

13,46 


1979 

318817 

406857 

99121 

476048 

16,71 


1980 

319341 

401942 

92705 

485108 

21,25 


1981 

325851 

419669 

85750 

484259 

21,33 


1982 

338507 

421716 

84100 

483879 

20,5 


1983 

339425 

417930 

83000 

481198 

20,5 


1984 

345194 

434696 

78300 

490881 

20,5 


1985 

358671 

456576 

82360 

502258 

20,5 


1986 

361026 

439654 

77234 

507199 

20,5 


1987 

365473 

438454 

73315 

505713 

21,82 


1988 

378488 

476345 

79831 

529460 

22,89 


1989 

394942 

492334 

87873 

546572 

23,26 


1990 

403194 

495939 

96139 

546982 

27,62 


1991 

412458 

513173 

91726 

566586 

29,45 


1992 

420028 

502520 

93140 

568582 

28,71 


1993 

420585 

523066 

91292 

569724 

28,56 


1994 

426893 

520728 

93073 

579846 

27,44 


1995 

433723 

518407 

98470 

588691 

23,05 


Nota: todos os dados nominais sao em pre 50 s constantes de mercado do ano de 1970 em milhoes de dracmas. A renda dispomvel 
privada e deflacionada pelo deflator de prego de consumo. 
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17.33. Usando os dados na Tabela 17.13, desenvolva um modelo adequado para explicar o compor- 
tamento do investimento bruto real na economia grega para o perfodo de 1960-1995. Con- 
suite qualquer livro de macroeconomia para informagoes sobre o modelo acelerador de 
investimento. 


Apendice 17A 


17A.1 O teste de Sargan para a validade dos instrumentos 


Suponha que usemos uma variavel instrumental para substituir uma variavel explanatoria que esteja 
correlacionada com o termo de erro. Qual a validade da variavel instrumental, ou seja, como sabemos que os 
instrumentos escolhidos sao independentes do termo de erro? Sargan desenvolveu um SARG estatrstico, 
chamado de SARG, para testar a validade dos instrumentos usados na variavel instrumental (VI).* As etapas envol- 
vidas no SARG sao as seguintes: * 1 

1. Divida as variaveis inclufdas em uma equagao de regressao em dois grupos, aqueles que sao independentes 
do termo de erro (por exemplo, X t , X 2 , . . . , X p ) e aqueles que nao sao independentes do termo de erro (por 
exemplo, Z b Z 2 ,..., Z q ). 

2. Sejam W t , W 2 , . . ., W s os instrumentos escolhidos para as variaveis Z em 1, em que s > q. 

3. Estime a regressao original, substituindo os Z pelos W, isto e, estime a regressao original pelo IV e obtenha 
os resrduos, por exemplo, u. 

4. Faga a regressao de u sobre uma constante, todas as variaveis X e todas as variaveis W, mas exclua todas as 
variaveis Z. Obtenha R 2 3 4 5 6 dessa regressao. 

5. Calcule agora a estatistica SARG, definida como: 

SARG = (« - k)R 2 ~ Xs- q (17A.1.1) 

Em que n = o numero de observagdes e k = o numero de coeficientes na equagao de regressao original. Sob a 
hipotese nula de que os instrumentos sao exogenos, Sargan mostrou que o teste SARG tern, assintoticamente, a 
distribuigao x 2 com (s — q) graus de hberdade, onde seo numero de instrumentos (isto e, as variaveis em W) e 
q 6 o numero de regressores na equagao original. Se o qui quadrado calculado em uma aplicagao e estatistica- 
mente significativo, rejeitamos a validade dos instrumentos. Se nao for estatisticamente significativo, poderemos 
aceitar o instramento escolhido como valido. Deve ser enfatizado que s > q, isto e, o numero de instrumentos 
deve ser maior que q. Se este nao for o caso (isto e, s < q), o teste de SARG nao sera valido; 

6. A hipotese nula e que todos os instrumentos (W) sao validos. Se o qui quadrado calculado exceder o valor 
critico de qui quadrado, rejeitaremos a hipotese nula, o que significa que pelo menos um instrumento estara 
correlacionado com o termo de erro e, portanto, as estimativas IV baseadas nos instrumentos escolhidos nao 
serao validas. 


* SARGAN, J. D. "Wages and prices in the United Kingdom: a study in econometric methodology". In: HART, P. E.; 
MILLS, G; WHITAKER, J. K. (Eds.). Econometric analysis for national economic planning. Londres: Butterworths, 
1964. 

* A discussao a seguir apoia-se em SEDDIGHI, H. R.; LAWLER, K. A.; KATOS, A. V. Econometrics: a practical approach. 
Nova York: Routledge, 2000. p. 155-156. 






Parte 


Modelos de equagoes 
simultaneas e econometria 
de series temporais 



Uma rapida pesquisa nos trabalhos empfricos publicados sobre negocios e economia revela que 
muitas das redoes economicas sao do tipo uniequacional (equa§ao unica). Por essa razao, dedicamos 
as tres primeiras partes deste livro ao debate sobre os modelos de regressao uniequacional. Neles, uma 
variavel (a variavel dependente Y) esta expressa como uma funcao linear de uma ou mais variaveis 
(as variaveis explanatorias, os X). Nesses modelos, uma premissa basica e que a re 1 119 ao de causa e 
efeito, se houver, entre o Y e os X e unidirecional. As variaveis explanatorias sao a causa e a variavel 
dependente e o efeito. 

Entretanto, ha situates nas quais existe um fluxo de influencia de mao dupla entre as variaveis 
economicas; ou seja, uma variavel economica afeta outra(s) variavel(eis) economica(s) e e, por sua 
vez, afetada por ela(s). Sendo assim, na regressao da moeda M sobre a taxa de juros r, a metodologia 
uniequacional supoe implicitamente que a taxa de juros e fixada (por exemplo, pelo Federal Reserve 
System) e busca descobrir a qualidade da moeda necessaria para trocas para cada nfvel da taxa de 
juros. Mas o que acontece se a taxa de juros depender da demanda por moeda? Nesse caso, a ana- 
lise de regressao condicional feita neste livro, ate aqui, pode nao ser adequada, porque agora M 
depende de r e r depende de M. Precisamos considerar duas equa 9 oes, uma que relacione Mare 
outra que relacione r a M. Isso nos leva a considerar os modelos de equa 9 oes simultaneas, modelos 
nos quais ha mais do que uma equa 9 ao de regressao, uma para cada variavel interdependente. 

Na Parte 4, apresentaremos uma introdu^ao bastante elementar e heurfstica ao complexo tema 
dos modelos de equates simultaneas, e deixamos os detalhes para as referencias. 

No Capitulo 18, apresentaremos varios exemplos de modelos de equa 9 oes simultaneas e mostra- 
remos por que o metodo dos minimos quadrados considerado anteriormente em geral nao se aplica a 
estimativa dos parametros de cada uma das equates do modelo. 

No Capitulo 19, consideraremos o conhecido problema da identitica^ao. Se, em um sistema de 
equa 9 oes simultaneas que contenha duas ou mais equa 9 oes, nao for possivel obter valores numericos 
de cada parametro em cada equa 9 ao, porque as equa 9 oes sao empiricamente indistingmveis, ou mui- 
to parecidas, temos o problema da identifica 9 ao. Sendo assim, na regressao da quantidade Q sobre o 
pre 90 P, a equa 9 ao resultante e uma fun 9 ao de demanda ou uma fun 9 ao de oferta (Q e P fazem parte 
de ambas as fun 9 oes)? Se tivermos apenas dados sobre Q c P c nenhuma outra informa 9 ao, sera diff- 
cil, senao impossivel, identificar a regressao como uma fun 9 ao de demanda ou oferta. E fundamental 
resolvermos o problema da identifica 9 ao antes de procedermos a estima 9 ao, porque, se nao sabemos 
o que estamos estimando, a estima 9 ao per se nao tem sentido. No Capitulo 19, mostraremos varios 
metodos para a resolu 9 ao do problema da identifica 9 ao. 

No Capitulo 20, consideraremos varios metodos de estima 9 ao que sao projetados especificamen- 
te para estimar modelos de equa 9 oes simultaneas e observaremos suas qualidades e limita 9 oes. 



Capitulo 

Modelos de equagoes 
simultaneas 



Neste e nos dois proximos capitulos, abordaremos os modelos de equa 9 oes simultaneas. Exami- 
naremos, em particular, suas caracterfsticas especiais, sua avalia 9 ao e alguns dos problemas estatfsti- 
cos a elas associados. 


18.1 A natureza dos modelos de equagoes simultaneas 

Nas Partes 1 e 3 deste livro, preocupamo-nos exclusivamente com os modelos uniequacionais, 
ou seja, modelos em que ha uma unica variavel dependente Y e uma ou mais variaveis explana¬ 
torias, os X. Nestes, a enfase esta na estimativa e/ou previsao do valor medio de Y condicionado 
aos valores fixos das variaveis X. Arela 9 ao de causa e efeito, se houver, passara nesses modelos dos 
X para os Y. 

Em muitas situa 9 oes, porem, essa rclayao de causa e efeito de mao unica ou unidirecional nao e 
significativa. Isso ocorre se Y estiver determinado pelos X e se alguns dos X, por sua vez, estiverem 
determinados por Y. Em resumo, existe uma relaqiao de mao dupla ou simultanea entre Y e (alguns 
dos) X, o que torna a disthujao entre variaveis dependentes e explanatorias de valor duvidoso. E me- 
lhor agregar um conjunto de variaveis que possam ser determinadas simultaneamente pelo conjunto 
restante de variaveis - exatamente o que e feito nos modelos de equafoes simultaneas. Nesses mode¬ 
los, ha mais de uma equagao - uma para cada variavel endogena ou mutua ou conjuntamente depen¬ 
dente 1 . E diferentemente dos modelos uniequacionais, nos de equa 9 oes simultaneas, devemos estimar 
os parametros de uma equa 9 ao unica sem levar em considera 9 ao as informa 9 oes oferecidas por outras 
equa 9 oes do sistema. 

O que ocorre se os parametros de cada equa 9 ao forem estimados por meio da aplica 9 ao, por 
exemplo, do metodo dos MQO, desconsiderando-se outras equa 9 oes do sistema? Lembre-se de 
que uma das hipoteses fundamentais do metodo dos MQO e que as variaveis explanatorias X sao 
nao estocasticas ou, se forem estocasticas (aleatorias), estao distribuidas independentemente do 
termo de erro estocastico. Se nenhuma dessas cond^oes for atendida, conforme mostramos, os 
estimadores de mmimos quadrados nao apenas estarao viesados, mas tambem inconsistentes; isso 
quer dizer que a medida que o tamanho da amostra aumenta indefinidamente, os estimadores nao 
convergem para seus verdadeiros valores (populacionais). Sendo assim, no seguinte sistema de 
equa 9 oes hipotetico, 2 


Y\i - Pio + PnY2i + Y\\X\i + Hii 


( 18 . 1 . 1 ) 


1 No contexto dos modelos de equates simultaneas, o conjunto de variaveis dependentes e chamado de varia¬ 
veis endogenas, e as variaveis realmente nao estocasticas, ou que assim podem ser consideradas, sao chamadas 
de variaveis exogenas ou predeterminadas. (Veja mais sobre esse tema no Capitulo 19.) 

2 Essa notagao economica, porem autoexplanatoria, sera generalizada em mais de duas equagoes no Capitulo 19. 
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Yu - Pi o + Pi\Y\, + Y2\Xh + U2i (18.1.2) 

em que Yi e Y 2 sao variaveis mutuamente dependentes ou endogenas, X l e uma variavel exogena e u\ 
e u 2 sao os termos de erro estocasticos, as variaveis 1j e Y 2 sao ambas estocasticas. Desse modo, a 
menos que se possa demonstrar que a variavel explanatoria estocastica Y 2 em (18.1.1) esteja dis- 
tribui'da independemente de e a variavel estocastica explanatoria Y l em (18.1.2) esteja distribufda 
independentemente de u 2 , a aplica£ao dos MQO classicos a essas equa£oes individualmente consi- 
deradas conduzira a estimativas inconsistentes. 

No restante deste capitulo, daremos alguns exemplos de modelos de equapoes simultaneas e 
mostraremos o vies envolvido na aplica£ao direta do metodo dos mmimos quadrados a esses mo¬ 
delos. Apos examinarmos o chamado problema da identificagao no Capitulo 19, discutiremos, no 
Capitulo 20, alguns dos metodos especiais desenvolvidos para lidar com os modelos de equagoes 
simultaneas. 


18.2 Exemplos de modelos de equagoes simultaneas 


EXEMPLO 18.1 Como se sabe, o prego Pde um produto e a quantidade Q vendida sao determinados pela 
Modelo de oferta intersecgao das curvas de oferta e demanda desse mesmo produto. Para simplificarmos, Po- 
, , demos supor que as curvas de oferta e demanda sejam lineares e, se acrescentarmos os ter- 

mos de erro estocasticos tq e u 2 , podemos escrever as fungoes de oferta e demanda empfricas 
como: 


Fungao de demanda: 

Fungao de oferta: 

Condigao de equilfbrio: 

em que Q d = quantidade demandada 
Q s = quantidade ofertada 
t = tempo 

e os a e p sao os parametros. A priori, espera-se que aq seja negativo (curva de demanda 
inclinada para baixo), e espera-se que /b seja positivo (curva de oferta inclinada para 
cima). 

Agora nao e muito dificil ver que P e Q sao variaveis conjuntamente dependentes. Se, 
por exemplo, L/ 1t em (1 8.2.1 ) muda em decorrencia das mudangas sobre as outras varia¬ 
veis que afetam Qf (como a renda, a saude e os gostos), a curva da demanda se desloca- 
ra para cima se u lt for positivo e para baixo se u u for negativo. Essas mudan^as estao na 
Figura 1 8.1. 

Conforme apresentado na figura, um deslocamento na curva da demanda altera tanto 
P quanto Q. De maneira semelhante, uma mudan^a em u 2t (decorrente de greves, do clima, 
de restrifoes as importagoes ou a exportagoes etc.) deslocara a curva da oferta, afetando 
novamente tanto P quanto Q. Em virtude da dependencia simultanea entre Q e P, u lt e P t 
em (1 8.2.1) e u 2 t e P t em (1 8.2.2) nao podem ser independentes. Portanto, uma regressao 
de Q contra P, como se observa em (1 8.2.1), violaria uma importante premissa do modelo 
classico de regressao linear, ou seja, a premissa de que nao ha correla^ao entre a(s) 
variavel(eis) explanatoria(s) e o termo de erro. 


Q t d = a 0 + a-\ P t + u-\ t 
Qt - Po+ P: Pt + u 2 t 
Qt = Qt 


a?i < 0 

Pt >0 


( 18 . 2 . 1 ) 

( 18 . 2 . 2 ) 


( Continua ) 
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EXEMPLO 18.1 

(' Continuagao) 

FIGURA 18.1 

Interdependence 
entre prego e 
quantidade. 



P 




EXEMPLO 18.2 

Modelo 
keynesiano de 
detenninagao 
da renda 


Considere o modelo keynesiano simples de determinagao da renda: 
Fungao consumo: Q = /0o + ySi Yt + u t 0 < < 1 

Indentidade de renda: Y t = C t + l t (= S t ) 


(18.2.3) 

(18.2.4) 


em que C = despesa de consumo 
Y = renda 

/ = investimento (considerado exogeno) 
5 = poupanga 
t = tempo 

u = termo de erro estocastico 
j8 0 e ^ = parametros 


O parametro f}-\ e conhecido como propensao marginal a consumir (PMC) (montante de 
gastos adicionais com consumo que resulta do aumento de um dolar na renda). De acordo 
com a teoria economica, espera-se que situe-se entre 0 e 1. A Equagao (18.2.3) correspon- 
de a fungao consumo (estocastica); e a Equagao (1 8.2.4) corresponde a identidade da renda 
nacional, e indica que a renda total e igual a despesa total de consumo mais a despesa total 
de investimento, sendo que a despesa total de investimento e igual a poupanga total. O dia- 
grama da Figura 18.2 ilustra esse dado. 

( Continua ) 
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EXEMPLO 18.2 

( Continuagao ) 


Com base na fungao consumo postulada e na Figura 18.2, fica claro que C e Y sao inter- 
dependentes e que nao se espera que Y t na Equagao (18.2.3) seja independente do termo de 
erro, porque, quando u t se desloca (em decorrencia de uma variedade de fatores inclufdos 
no termo de erro), a fungao consumo tambem se desloca. Por sua vez, ela afeta Y t . Mais 
uma vez o metodo classico dos minimos quadrados nao pode ser aplicado a Equagao 
(18.2.3). Se for aplicado, os estimadores obtidos serao inconsistentes, conforme demons- 
traremos adiante. 


FIGURA 18.2 

Modelo 
keynesiano de 
determinagao da 
renda. 


C,I 



EXEMPLO 18.3 Considere o seguinte modelo de determinagao de salarios nominais e pregos do tipo cur- 

Modelos de va de Phillips: 

salario-prego 

Wt = ao + ai UNt + ctz Pt + u-\t (18.2.5) 

Pt= /6o+ faW t + p 2 R t + P sM t + u 2t (18.2.6) 


em que 


W= taxa de variagao dos salarios nominais 
UN = taxa de desemprego, % 

P= taxa de variagao dos pregos 
R = taxa de variagao dos custos do capital 
M= taxa de variagao do prego das materias-primas importadas 
t = tempo 

u |, u 2 = termos de erro estocasticos 


Na medida em que a variavel prego P entra na equagao dos salarios e a variavel salario W 
entra na equagao dos pregos, as duas estao conjuntamente dependentes. Sendo assim, 
espera-se que essas variaveis explanatorias estocaticas estejam correlacionadas com os ter¬ 
mos de erro estocasticos relevantes, o que novamente torna o metodo de MQO nao apli- 
cavel para estimar os parametros das duas equagoes individualmente. 
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EXEMPLO 18.4 

0 modelo IS da 
macroeconomia 


Em sua forma nao estocastica, o famoso modelo IS, ou do equilfbrio do mercado de 
bens 3 , pode ser expresso como: 


Fungao consumo: 

C t = Po+ fit Ydt 0 < f}-\ < 1 

(18.2.9) 

Fungao de arrecadagao de impostos: 

Tt = ao + o :-\Y t 0 < oq <1 

(18.2.8) 

Fungao investimento: 

h= yo + yi ft 

(18.2.9) 

Definigao: 

1 

II 

(18.2.10) 

Castos do governo: 

C t = G 

(18.2.11) 

Identidade da renda nacional: 

Y t = C t + h + C t 

(18.2.12) 


em que Y = renda nacional 

C = despesas de consumo 
/ = investimento Ifquido planejado ou desejado 
C = nfvel dado de gastos do governo 
T = impostos 
Y d = renda disponfvel 
r= taxa de juros 


Se voce substituir as Equagoes (18.2.10) e (18.2.8) pela Equa^ao (18.2.7), substituir a equa- 
5 §o resultante por C e ainda substituir as Equagoes (18.2.9) e (18.2.11) pela Equa^ao 
(18.2.12), podera obter a equag:ao IS: 


em que 


Y t =no+yf\r t (18.2.13) 

Po ~ + yo + C 

n ° ~ 1-^O-aO 

1 

771 “ 1 - /3i(1 - ai) (18.2.14) 


A Equa^ao (18.2.1 3) e a equa^ao do IS ou do equilfbrio do mercado de bens, ou seja, ela 
nos da as combinagoes da taxa de juros e do nfvel de renda de maneira que o mercado de 
bens estabiliza-se ou mantem-se em equilfbrio. Geometricamente, a curva IS esta apresenta- 
da na Figura 18.3. 


FIGURA 18.3 

A curva IS. 


r 



( Continua ) 


3 Os pontos de equilfbrio de mercado de bens, ou curva IS, mostram combinagoes de taxas de juros e nfveis de 
produto de modo que as despesas planejadas iguaiem-se a renda. Ver DORNBUSCH, Rudiger; FISCHER, Stanley. 
Macroeconomics. 3. ed. Nova York: McGraw-Hill, 1984, p. 102. Observe que, para simplificarmos, desconsidera- 
mos o setor do comercio internacional. 
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EXEMPLO 18.4 

( Continuagao ) 


O que aconteceria se estimassemos a fungao consumo (18.2.7) isoladamente? Poderfa- 
mos obter estimativas nao tendenciosas e/ou consistentes de p 0 e fa? Esse resultado e impro- 
vavel, porque o consumo depende da renda disponfvel, que depende da renda nacional, Y, 
mas esta ultima depende de re C, bem como de outros parametros que entram em n 0 . Por- 
tanto, a menos que tomemos em consideragao todas essas influences, uma simples regres- 
sao de Ccontra V^conduzira obrigatoriamente a estimativas tendenciosas e/ou inconsistentes 
de p 0 e fa ■ 


EXEMPLO 18.5 A outra metade do famoso paradigma IS-LM e a rela^ao LM ou equilfbrio do mercado 
0 modelo LM monetario, o qual apresenta as combinafoes de taxas de juros e nfvel de renda, as quais 
ajustam o mercado monetario, ou seja, igualam a demanda a oferta de dinheiro. Em termos 
algebricos, o modelo, em sua forma nao estocastica, pode ser representado como: 


Fungao de demanda par moeda: 
Fungao de oferta de moeda: 
Condigao de equilfbrio: 


Mf - a+ bY t - cr t 


Ml = M 
Mf = M s t 


(18.2.15) 

(18.2.16) 
(18.2.17) 


em que Y = renda, r = taxa de juros e M = nfvel hipotetico de moeda determinado pelo 
FED. 

Igualando as fun^oes de demanda e oferta, e simplificando, obtemos a equafao LM: 


Y t = A 0 + At M + k 2 r t (18.2.18) 

em que 

X 0 = - a/b 

7.1 = 1 /b (18.2.19) 

X 2 = c/b 

Para dado M = M, a curva LM representa a rela^ao (18.2.18), como vemos na Figura 18.4. 

As curvas IS e LM mostram, respectivamente, que ha toda uma gama de taxas de juros 
compatfveis com o equilfbrio do mercado de bens e uma gama de taxas de juros compatf- 
veis com o equilfbrio no mercado monetario. Certamente, apenas uma taxa de juros e um 
nfvel de renda serao simultaneamente compatfveis com os dois equilfbrios. Para obte-los, 
tudo o que precisamos fazer e igualar as Equagoes (1 8.2.1 3) e (18.2.1 8). No Exercfcio 1 8.4, 
solicitamos que voce demonstre os nfveis da taxa de juros e da renda simultaneamente 
compatfveis com o equilfbrio do mercado de bens e monetario. 

FIGURA 18.4 
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EXEMPLO 18.6 

Modelos 

econometricos 


Tem sido feito um amplo uso dos modelos de equagoes simultaneas nos modelos econo¬ 
metricos construfdos por diversos econometristas. Um dos pioneiros nesse campo foi o pro¬ 
fessor Lawrence Klein, da Wharton School da Universidade da Pensilvania. Seu modelo inicial, 
conhecido como modelo de Klein I, e o seguinte: 


Fungao consumo: 

Fungao investimento: 
Demanda por mao de obra: 

Identidade: 

Identidade: 

Identidade: 


Ct = A) + Pi F’t + W + W') t + Ps F’t -1 + Uu 
It = @4+ Ps Pt+ p6 F’t- 1 + K t - 1 + U2t 
W t = fa + p 9 (Y+ T- W') t 

+ /Sio (Y + T - W') t - 1 + jSn t + ust 
Y t + T t = C t + l t + C t 
Y t = w; + W t + F’t 
K t = K t -1 + It 


( 18 . 2 . 20 ) 


em que C = despesas de consumo 

/ = despesas de investimento 
C = gastos do governo 
P = lucros 

1/1/ = folha de pagamento do setor privado 
1/1/'= folha de pagamento do setor publico 
K = estoque de capital 
T = impostos 

Y = renda com o desconto dos impostos 
t = tempo 

iq, u 2 e t/ 3 = termos de erro estocastico * * * 4 

No modelo anterior, as variaveis C, /, W, Y, P e K sao consideradas conjuntamente depen- 
dentes ou endogenas, e as variaveis P t _t, K t-1 e Y t _\ sao consideradas predeterminadas. 5 Ao 
todo, ha seis equates (incluindo as tres identidades) para estudar a interdependence das 
seis variaveis endogenas. 

No Capftulo 20, veremos como esses modelos econometricos podem ser estimados. No 
momento, observe que, em decorrencia da interdependence que ha entre as variaveis endo¬ 
genas, em geral, elas nao sao independentes dos termos de erro estocastico, o que, por 
conseguinte, torna inadequado aplicar o metodo dos MQO a uma equafao individual do 
sistema. Conforme mostraremos na Segao 18.3, os estimadores assim obtidos sao inconsis- 
tentes; nao convergem aos seus verdadeiros valores populacionais mesmo quando o tama- 
nho da amostra e grande. 


18.3 O vies das equagdes simultaneas: 

inconsistency dos estimadores de MQO 


Como j a foi mencionado, o metodo dos mfnimos quadrados nao pode ser aplicado para estimar 

uma linica equagao inserida em um sistema de equaqocs simultaneas se uma ou mais variaveis expla- 

natorias estiverem correlacionadas com o termo de erro da equa 5 ao, pois os estimadores assim obti¬ 
dos serao inconsistentes. Para demonstrar isso, retomemos o modelo keynesiano de determina§ao da 


4 KLEIN, L. R. Economic fluctuations in the United States, 1921 -1941. Nova York: John Wiley & Sons, 1950. 

5 0 elaborador do modelo devera especificar quais das variaveis sao endogenas e quais sao predeterminadas. 
K t _i e Y, _ t sao predeterminadas, porque, no perfodo t, seus valores sao conhecidos. (Esse tema sera retomado 
no Capftulo 19.) 
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renda apresentado no Exemplo 18.2. Suponha que desejemos estimar os parametros da funpao con- 
sumo (18.2.3). Considerando que E(u t ) — 0, E (u 2 ) a 2 , E(u,u t+] ) — 0 (para j ^ 0) e cov (/,, u ,) = 0, os 
quais sao premissas do classico modelo de regressao linear, demonstramos primeiro que Y, e u, em 
(18.2.3) estao correlacionados e, entao, provamos que /l, e um estimador inconsistente de /J,. 

Para demonstrarmos que Y,e u, estao correlacionados, procedemos da seguinte maneira. Substituf- 
mos a Equapao (18.2.3) na Equapao (18.2.4) para obtermos: 


ou seja. 


Agora 


Y t — Po + P\Yt + u, + I, 


Y t = 


Po 

1 - Pi 


+ 


1 

1 - Pi 


It + 


1 


1 -Pi 


u, 


E(Y ,) = 


Po 

l- Pi 


+ 


1 

Pi 


I, 


(18.3.1) 


(18.3.2) 


em que nos utilizamos do fato de que E{u,) — 0 e de que /„ sendo exogeno ou predeterminado 
(porque foi fixado antecipadamente), tem como valor esperado /,. 

Sendo assim, a subtrapao da Equapao (18.3.2) da Equapao (18.3.1) resulta em: 


Y t - E(Y t ) = (18.3.3) 

1 - Pi 

Alem disso, 


de onde 

co v(Y t , Uf) = 


Como a 2 e positivo por hipotese (por que?), a covariancia entre Yen dada na Equapao (18.3.5) esta 
fadada a ser diferente de zero. 6 Como resultado, espera-se que Y, e u, na Equapao (18.2.3) estejam 
correlacionados, o que viola a premissa do modelo da regressao linear classico de que os termos de erro 
estao independentes ou, pelo menos, nao correlacionados com as variaveis explanatorias. Conforme 
observamos anteriormente, os estimadores de MQO nessa situapao sao inconsistentes. 

Para demonstrarmos que o estimador de MQO P\ e um estimador inconsistente de p\ em decor- 
rencia da correlapao entre Y, e u t , procedemos da seguinte maneira: 


u t - E(u t ) = u, (Por que?) 


(18.3.4) 


E[Y t - E(Y t )][u t - E(u,)] 
E(u 2 ) 


1 - Pi 


para Equapoes (18.3.3) e (18.3.4) 


(18.3.5) 


1 - Pi 


IJCt - C)(Y t - Y) 
UY, ~ Y) 2 
H c tYt 

Eyf 
E C,y t 
Ev , 2 


(18.3.6) 


6 Sera maior do que zero na medida em que a PMC, estiver entre 0 e 1, e sera negativa se ft for maior do que 
a unidade. Certamente, um valor de PMC maior do que a unidade nao faria muito sentido economico. Desse 
modo, na verdade, e esperado que a covariancia entre Y t e u t seja positiva. 














Capftulo 18 Modelos de equagoes simultdneas 675 


em que as minusculas, como de costume, indicam desvios em relapao aos valores medios (da amostra). 
Substituindo por C, da Equapao (18.2.3), obtemos: 


A = 


E(Po + PiYt + u,)y, 


Pi + 


Eyf 

T,yt u > 

Eyf 


(18.3.7) 


em que, na ultima etapa, utilizamos o fato de que ^ yt = 0 e (E Y,y t /Eyf) = 1 (por que?). 
Se considerarmos a expectativa de Equapao (18.3.7) de ambos os lados, obteremos: 


£(A) = Pi + E 


~ Eyt u t ~ 

. Eyf . 


(18.3.8) 


Infelizmente, nao podemos avaliar E(Eyt u t/ E , v f)’ pois ° operador de expectativas e um ope- 
rador linear [Observe: E (A/B)±E(A)/E(B).\. Porem, intuitivamente, deveria estar claro que, amenos 
que o termo ( Eyt u t / Eyf ) seja zero, /l, e um estimador viesado de A- Mas nao demonstramos na 
Equapao (18.3.5) que a covariancia entre Yens nao zero e, por conseguinte, A nao deveria ser vie¬ 
sado? A resposta e: nao, pois cov (K„ «,), um conceito populacional, nao e, na verdade, o mesmo que 
E yt u t,o qual e uma medida da amostra, embora, pelo fato de o tamanho da amostra aumentar inde- 
finidamente, esta ultima tenda a tornar-se a primeira. Mas, se o tamanho da amostra aumenta indefi- 
nidamente, podemos recorrer ao conceito do estimador consistente e descobrir o que acontece com A 
quando n, o tamanho da amostra, aumenta indefinidamente. Em resumo, quando nao podemos avaliar 
explicitamente o valor esperado de um estimador, como na Equapao (18.3.8), podemos voltar nossa 
atenpao para o seu comportamento em uma grande amostra. 

Agora dizemos que um estimador e consistente se o seu limite em probabilidade 7 ou plim 
(abreviando do ingles, probability limit ) for igual a seu verdadeiro valor (populacional). Sendo assim, 
para demonstrar que /), da Equapao (18.3.7) e inconsistente, devemos provar que seu plim nao e igual 
ao verdadeiro /3 l . Aplicando as regras do limite em probabilidade a Equapao (18.3.7), obtemos: 8 

Plim (A) = plim (A) + plim 


Evtut/n 

, £*?/» , 
Plim {EytUt/n) 
plim {Eyt/n) 


plim (A) + plim | 


Pi + 


(18.3.9) 


em que, na segunda etapa, dividimos E Yt u t e EEt P e l° numero total de observapoes na amostra n, 
de modo que as quantidades entre parenteses sao agora a covariancia amostral entre feuea variancia 
amostral de Y, respectivamente. 

Em palavras, a Equapao (18.3.9) afirma que o limite em probabilidade de A e igual ao verdadeiro 
/l, mais o quociente do plim da covariancia amostral entre Yen para o plim da variancia amostral de 
Y. Agora, na medida em que o tamanho da amostra n aumenta indefinidamente, pode-se esperar que 
a covariancia amostral entre Fen aproxime-se da verdadeira covariancia populacional E[Yt — E(Y,)\ 
[ iij — E(u,)\, que, por meio da Equapao (18.3.5), e igual a [ct 2 /(1 — A)]. D e maneira semelhante, a 
medida que n tende a ser infinite, a variancia da amostra de Y aproximara a sua variancia populacio¬ 
nal, por exemplo <r y 2 . Portanto, a Equapao (18.3.8) pode ser escrita como: 


7 Ver Apendice A para uma definipao do limite em probabilidade. 

8 Como afirmamos no Apendice A, o plim de uma constante (por exemplo, ft) e a mesma constante e o plim de 
(A/B) = plim (/4)/plim (8). Observe, entretanto, que E(A/B) * E(A)/E(B). 
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plim(^j) 


ft + 


a 2 /(l- ft) 


ft + 


1 - ft \<7y 


(18.3.10) 


Dado que 0 < ft < 1 e que cr 2 e cry sao positivos, e obvio que, com base na Equa§ao (18.3.10), plim 
(ft) sera sempre maior que ft x \ ou seja, ft x superestimarao verdadeiro /3j. 9 Em outxas palavras, ft x e um 
estimador viesado e o vies nao desaparecera nao importando o tamanho da amostra. 


18.4 O vies das equagdes simultaneas: um exemplo numerico 

Para demonstrar alguns dos pontos indicados na se^ao anterior, retomemos o modelo keynesiano 
simples de determina§ao da renda do Exemplo 18.2 e vamos prosseguir com o seguinte experimento 
de Monte Carlo. 10 Imaginemos que os valores de investimento sejam os apresentados na coluna 3 da 
Tabela 18.1. Em seguida, suponhamos que 


E(u t ) = 0 

E(u,u t +j ) =0 O' ^ 0) 
var(«,) = a 1 = 0,04 
cov(iq, I,) = 0 


Os u, assim gerados sao mostrados na coluna (4). 

Para a fun 9 ao consumo (18.2.3), imagine que os valores dos parametros verdadeiros sejam conhe- 
cidos e sejam /3 Q = 2e /3\ = 0,8. 

Com base nos valores considerados de ft 0 e ft { e os gerados de u,, podemos gerar os valores de renda 
Y, da Equa 9 ao (18.3.1), os quais sao apresentados na coluna 1 da Tabela 18.1. Uma vez que Y, sao conhe- 
cidos e conhecendo ft (h (i\ e «„ e possivel gerar facilmente os valores de consumo C, da Equagao (18.2.3). 
Os C assim gerados sao apresentados na coluna (2). 

Desde que os verdadeiros j} 0 e [1\ sejam conhecidos e na medida em que os erros na amostra sao 
exatamente os mesmos que os “verdadeiros” erros (em virtude de como formulamos o experimento 
de Monte Carlo), se utilizassemos os dados da Tabela 18.1 para fazer a regressao de C, contra Y„ 
deverfamos obter /3 0 = 2 e /3\ — 0,8 se os MQO fossem nao viesados. Porem, por meio da Equa 9 ao 
(18.3.7), sabemos que nao sera esse o caso se o regressor Y, e o termo de erro «,estiverem correlacio- 
nados. Agora nao e muito dificil verificar, com base em nossos dados, que a covariancia (amostral) entre 
Y, e u t e Ylyt u t = 3,8eque ^Zj 2 = 184.Entao, como a Equa 9 ao (18.3.7) mostra, devemos ter: 


HytUt 

'Ey} 

3,8 
184 
= 0,82065 


ft = ft + 


= 0,8 + 


(18.4.1) 


Ou seja, fti apresenta um vies superior a 0,02065. 


9 Em geral, porem, a diregao do vies dependera da estrutura do modelo especffico e dos valores verdadeiros dos 
coeficientes de regressao. 

i° E Ste g um emprestimo de WHITE, Kenneth J.; HORSMAN, Nancy G.; WYATT, Justin B. SHAZAM: computer hand¬ 
book for econometrics for use with basic econometrics. Nova York: McGraw-Hill, 1985, p. 131-134. 
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TABELA 18.1 

Fonte: White, Kenneth J.; 
Horsman, Nancy G.; Wyatt, 
Justin B. SHAZAM: 
Computer Handbook for 
Econometrics for Use with 
Damodar Gujarati: Basic 
Econometrics, p. 132, set. 
1985. 


Y t 

Q 

It 


0) 

(2) 

(3) 

(4) 

18,15697 

16,15697 

2,0 

-0,3686055 

19,59980 

17,59980 

2,0 

—0,8004084E-01 

21,93468 

19,73468 

2,2 

0,1869357 

21,55145 

19,35145 

2,2 

0,1102906 

21,88427 

19,48427 

2,4 

-0,2314535E-01 

22,42648 

20,02648 

2,4 

0,8529544E-01 

25,40940 

22,80940 

2,6 

0,4818807 

22,69523 

20,09523 

2,6 

-0,6095481 E-01 

24,36465 

21,56465 

2,8 

0,7292983E-01 

24,39334 

21,59334 

2,8 

0,7866819E-01 

2409215 

21,09215 

3,0 

-0,1815703 

24,87450 

21,87450 

3,0 

—0,2509900E-01 

25,31580 

22,11580 

3,2 

-0,1368398 

26,30465 

23,10465 

3,2 

0,6092946E-01 

25,78235 

22,38235 

3,4 

-0,2435298 

26,08018 

22,68018 

3,4 

-0,1839638 

27,24440 

23,64440 

3,6 

-0,1511200 

28,00963 

24,40963 

3,6 

0,1926739E-02 

30,89301 

27,09301 

3,8 

0,3786015 

28,98706 

25,18706 

3,8 

—0,2588852E-02 


Agora, vamos fazer a regressao de C, contra Y„ utilizando os dados fornecidos na Tabela 18.1. Os 
resultados da regressao sao: 

C, = 1,4940 + 0,820657, 

ep= (0,35413) (0,01434) 

t= (4,2188) (57,209) R 2 = 0,9945 

Conforme esperado, o ft\ estimado e precisamente aquele previsto pela Equa£ao (18.4.1). Cabe 
observar que o ft 0 tambem e viesado. 

Em geral, a magnitude do vies de ft\ depende de ft], a 2 e var(7) e, principalmente, do grau de 
covariancia entre Ye u. n Como Kenneth White et al. observam, “e disso que trata o vies das equa- 
9 oes simultaneas. Diferentemente dos modelos de cquagao linica, nao podemos mais afirmar que as 
variaveis que estao do lado direito da equa£ao nao estao correlacionadas com o termo de erro”. 12 
Deve-se ter em vista que esse vies permanece mesmo em grandes amostras. 

Em decorrencia das consequencias potencialmente serias da aplica 9 ao dos MQO nos modelos de 
equa 9 oes simultaneas, ha um teste de simultaneidade que nos possa dizer se, em determinado caso, 
temos o problema da simultaneidade? Uma versao do teste de especifica 9 ao de Hausman pode ser 
utilizada com essa finalidade, conforme analisaremos no Capitulo 19. 


11 Ver Equafao (18.3.5). 

12 Op. cit., p. 133-1 34. 
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Resumo e 
conclusoes 


EXERCICIOS 


1. Diferentemente dos modelos de equagao unica, nos modelos de equagoes simultaneas ha mais do 
que uma variavel dependente ou endogena envolvida, o que torna necessario que haja tantas 
equagdes quanto o numero de variaveis endogenas; 

2. Uma caracteristica exclusiva dos modelos de equagdes simultaneas e que a variavel endogena 
(isto e, o regressando) em uma equagao pode aparecer como uma variavel explanatoria (isto e, 
regressor) em uma outra equagao do sistema; 

3. Como consequencia, essa variavel explanatoria endogena torna-se estocastica e esta normal- 
mente correlacionada ao termo de erro da equagao em que aparece como variavel explanatoria; 

4. Nessa situagao, o metodo classico dos MQO nao pode ser aplicado, porque os estimadores obti- 
dos nao sao consistentes, ou seja, nao convergem para seus verdadeiros valores populacionais, 
independentemente de quao grande seja o tamanho da amostra; 

5. O experimento de Monte Carlo, apresentado no texto, mostra a natureza do vies envolvido na 
aplicagao dos MQO para estimar os parametros de uma equagao de regressao em que o regressor 
esta correlacionado com o termo de erro, o que corresponde exatamente ao caso dos modelos de 
equagdes simultaneas; 

6. Dado que os modelos de equagoes simultaneas sao frequentemente empregados, especialmente 
nos modelos de econometria, tecnicas altemativas para estimagao tem sido formuladas por diver- 
sos autores. Essas tecnicas serao analisadas no Capftulo 20, apos abordarmos o topico problemas 
de identificagao, no Capftulo 19, item que logicamente antecede a estimagao. 


18.1. Desenvolva iim modelo de equagdes simultaneas para a oferta e demanda de dentistas nos 
Estados Unidos. Especifique as variaveis endogenas e exogenas do modelo. 

18.2. Desenvolva um modelo simples da demanda e da oferta de dinheiro nos Estados Unidos 
e compare seu modelo com aqueles desenvolvidos por K. Brunner, A. H. Meltzer* e R. 
Tiegen. 1 

18.3. a. Para o modelo de oferta e demanda do Exemplo 18.1, obtenha a expressao para o limite em 
probabilidade de a l . 

b. Sob quais condigoes esse limite em probabilidade sera igual ao verdadeiro oq? 

18.4. Para o modelo IS-LM debatido no texto, encontre o nfvel da taxa de juros e da renda simulta- 
neamente compatfvel com o equilfbrio do mercado de bens e de moeda. 

18.5. Para estudar a relagao entre a inflagao e o rendimento das agoes ordinarias, Bruno Oudet uti- 
lizou-se do seguinte modelo: 

Rbt = oq + oi2Rst “t" otiRbt-i + ct4 Lt + oqEf + ojgNIS^ + + wn 

Rst = Pi + Pi Rbt + Pi Rbt -1 + PaLi + PsY t + /leNIS; + p-iE t + U2t 

em que L — base monetaria real per capita 
Y — renda real per capita 
I — taxa de inflagao esperada 


* "Some further evidence on supply and demand functions for money", journal of Finance, v. 19, p. 240-283, maio 
1964. 

t"Demand and supply Functions for money in the United States". Econometrica, out. 1964. v. 32, n. 4, p. 476- 
509. 

f OUDET, Bruno A. "The variation of the return on stocks in periods of inflation". Journal of Financial and Quantitative 
Analysis, mar. 1973. v. 8, n 2, p. 247-258. 
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NIS = variavel de novas emissoes 

E — retornos das agocs esperados em fins de periodos, representados pelos quo- 
cientes defasados dos prccos das agoes 
R bt — rendimentos dos tftulos de dfvidas 
R st — retornos das agoes ordinarias. 


a. Apresente uma justificativa teorica para esse modelo e verifique se o seu raciocinio esta de 
acordo com o de Oudet. 

b. Quais as variaveis endogenas do modelo? Quais as variaveis exogenas? 

c. Voce consideraria o R b , endogeno ou exogeno? 

18.6. No artigo, “A Model of the Distribution of Branded Personal Products in Jamaica”,* John U. 
Farley e Harold J. Levitt desenvolveram o seguinte modelo (os produtos de cuidados pessoais 
considerados foram creme de barbear, creme para pele, papel higienico e creme dental): 

Yu - a\ + P\ Y 2 i + PiYa + PjY 4i + un 

Yli — 0(2 + P^Yu + PsYsi + Y\X\i + Yl^li + u 2i 

Yji - «3 + PbYli + K3^3i + M 3i 

Yto - OLi, + Pi Yli + K4^4i + «4i 

Y$i = 0:5 + PaYn + PqYn + P10Y41 + U5 i 


em que Y t = percentual de lojas que estocam o produto 
Y 2 — vendas em unidades/mes 

Y 3 = fndice de contato direto com o importador e o fabricante do produto 
Y 4 — fndice da atividade atacadista na area 

Y 5 — fndice de quantidade do estoque de marcas para o produto (ou seja, o numero 
medio de marcas do produto estocadas pelas lojas que vendem o produto) 

A| = publico-alvo do produto 

X 2 — renda per capita da localidade em que a area esta situada 

X 3 = distancia entre o centro de gravidade populacional e Kingston 

X 4 — distancia entre o centro populacional e o centro atacadista mais proximo. 

a. Voce conseguiria identificar as variaveis endogenas e exogenas desse modelo? 

b. Uma ou mais equagoes do modelo podem ser estimadas pelo metodo dos mfnimos quadra- 
dos? Por que? 

18.7. Para estudar a relagao entre o gasto com propaganda e a venda de cigarros, Frank Bass utilizou o 
seguinte modelo: 1 

Y\ t = ai + P\Y 3t + fi 2 Y 4t + Yi^u + YiXit + u\t 
Yit = a 2 + foY^t + /3 4 Y 4t + YiX\, + Ya^h + u 2t 
Yu - a 3 + PsYu + P(,Y 2t + u 3t 
Y 4t = a 4 + PjY\ t + ft%Y 2t + u 4 f 


em que Y t = logaritmo de vendas de cigarros com filtro (numero de cigarros) dividido pela 
populagao com idade acima de 20 anos. 

Y 2 = logaritmo de vendas de cigarros sem filtro (numero de cigarros) dividido pela 
populagao com idade acima de 20 anos. 


* journal of Marketing Research, nov. 1968. p. 362-368. 

t "A simultaneous equation regression study of advertising and sales of cigarettes", lournal of Marketing Research, 
ago. 1969. v. 6, p. 291-300. 
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ft = logaritmo dos dolares gastos com a propaganda de cigarros com filtro dividido 
pela popula^ao com idade acima de 20 anos e pelo fndice de pre 90 s da propa¬ 
ganda 

Y 4 — logaritmo dos dolares gastos com a propaganda de cigarros sem filtro dividido 
pela popula 9 ao com idade acima de 20 anos e pelo fndice de pre 90 s da propa¬ 
ganda 

ft = logaritmo da renda pessoal disponfvel dividido pela popukufto com idade acima 
de 20 anos e pelo fndice de pregos ao consumidor 
X 2 — logaritmo do pre?o do mapo de cigarros sem filtro dividido pelo indice de prepos 
ao consumidor. 

a. Nesse modelo os Y sao endogenos e os X sao exogenos. Por que o autor considra ft exogeno? 

b. Se X 2 fosse tratado como uma variavel endogena, como voce modificaria o modelo? 

18.8. G. Menges elaborou o seguinte modelo econometrico para a economia da Alemanha Ociden- 
tal :* 

Y t = ft + ft Y t ~ i + ft It + u\ t 
It — ft + ft^( + PsQt + «2 1 
C, = ft + ft Yt + fig C t -1 + ftft + ui t 
Qt = Pio + P\iQt-\ + PnRt + UAt 

em que Y — renda nacional 

I — forma^ao Ifquida de capital 
C — consumo pessoal 
Q — lucres 

P — fndice do custo de vida 
R = produtividade industrial 
t — tempo 

u = termos de erro estocasticos 

a. Quais das variaveis voce consideraria endogenas? E exogenas? 

b. Ha alguma equa 9 ao no sistema que possa ser estimada pelo metodo uniequacional dos 
mfnimos quadrados? 

c. Qual o motivo que esta por tras da inclusao da variavel P na fun 9 ao consumo? 

18.9. L. E. Gallaway e P. E. Smith elaboraram um modelo simples para a economia dos Estados 
Unidos, como vemos a seguir: 1 

Y t = C t + I, + G, 

Q = ft + ftYD,_i + ft-M, + u\, 

It - ft + ft(}ft l _ Y t 2) + ftft-i + u 2t 

G, = ft + ftG;_ 1 + u 2t 


em que Y — produto nacional bruto 

C — despesa de consumo pessoal 
I = investimento privado intemo bruto 


'MENGES, G. "Ein okonometriches modell der bundesrepublik deutschland (vier strukturgleichungen)". I.F.O. 
Studien, 1959. v. 5, p. 1-22. 

t "A quarterly econometric model of the United States". Journal of American Statistical Association, 1961. v. 
56, p. 379-383. 
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G — gasto do governo mais investimento estrangeiro h'quido 
YD = renda disponfvel ou com os impostos descontados 
M — oferta de moeda no infcio do trimestre 
Z = renda patrimonial antes do desconto dos impostos 
t — tempo 

«i,« 2 e« 3 = termos de erro estocasticos 

Todas as variaveis sao medidas na forma de primeira difercnca. 

Com base nos dados trimestrais do perfodo entre 1948-1957, os autores aplicaram o metodo 
dos minimos quadrados a cada uma das equagoes e obtiveram os seguintes resultados: 

C, = 0,09+ 0,43YD,_, + 0,23 M, R 2 = 0,23 

I, = 0,08 + 0,43(Y r _! - Y t - 2 ) + 0,48Z, R 2 = 0,40 

G t = 0,13 + 0,67G f _i R 2 = 0,42 

a. Como voce justificaria o uso do metodo dos minimos quadrados nesse caso? 

b. Por que os valores de R 2 estao tao baixos? 

Exercfcios aplicados 

18.10. A Tabela 18.2 fornece dados sobre o Y (produto interno bruto), I (investimento interno pri- 
vado bruto) e C (despesa de consumo pessoal) nos Estados Unidos durante o perfodo entre 
1970-2006. Todos os dados estao em bilhoes de dolares de 1996. Suponha que C esteja 


TABELA 18.2 Despesa de consumo pessoal, investimento privado interno bruto e PIB, Estados Unidos, 1970-2006 (bilhoes de 
dolares de 1996) 


Ano 

C 

/ 

Y 

Ano 

C 

/ 

Y 

1970 

2.451,9 

427,1 

3.771,9 

1989 

4.675,0 

926,2 

6.981,4 

1971 

2.545,5 

475,7 

3.898,6 

1990 

4.770,3 

895,1 

7.112,5 

1972 

2.701,3 

532,1 

4.105,0 

1991 

4.778,4 

822,2 

7.100,5 

1973 

2.833,8 

594,4 

4.341,5 

1992 

4.934,8 

889,0 

7.336,6 

1974 

2.812,3 

550,6 

4.319,6 

1993 

5.099,8 

968,3 

7.532,7 

1975 

2.876,9 

453,1 

4.311,2 

1994 

5.290,7 

1.099,6 

7.835,5 

1976 

3.035,5 

544,7 

4.540,9 

1995 

5.433,5 

1.134,0 

8.031,7 

1977 

3.164,1 

627,0 

4.750,5 

1996 

5.619,4 

1.234,3 

8.328,9 

1978 

3.303,1 

702,6 

5.015,0 

1997 

5.831,8 

1.387,7 

8.703,5 

1979 

3.383,4 

725,0 

5.173,4 

1998 

6.125,8 

1.524,1 

9.066,9 

1980 

3.374,1 

645,3 

5.161,7 

1999 

6.438,6 

1.642,6 

9.470,3 

1981 

3.422,2 

704,9 

5.291,7 

2000 

6.739,4 

1.735,5 

9.817,0 

1982 

3.470,3 

606,0 

5.189,3 

2001 

6.910,4 

1.598,4 

9.890,7 

1983 

3.668,6 

662,5 

5.423,8 

2002 

7.099,3 

1.557,1 

10.048,8 

1984 

3.863,3 

857,7 

5.813,6 

2003 

7.295,3 

1.613,1 

10.301,0 

1985 

4.064,0 

849,7 

6.053,7 

2004 

7.561,4 

1.770,2 

10.675,8 

1986 

4.228,9 

843,9 

6.263,6 

2005 

7.803,6 

1.869,3 

11.003,4 

1987 

4.369,8 

870,0 

6.475,1 

2006 

8.044,1 

1.919,5 

11.319,4 

1988 

4.546,9 

890,5 

6.742,7 






Notas: C = despesa de consumo pessoal. 

I = Investimento privado interno bruto. 

Y = produto interno bruto. 

Fonte: Economic Report of the President, 2008, Tabela B-2. 
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linearmente relacionado com Y como no modelo keynesiano simples de determinayao da 
renda do Exemplo 18.2. Obtenha as estimativas de MQO dos parametros da funyao consu- 
mo. Guarde os resultados para retomar os mesmos dados utilizando-se dos metodos apre- 
sentados no Capftulo 20. 

18.11. Por meio dos dados do Exercfcio 18.10, faya a regressao do investimento interno bruto, I, 
sobre o PIB e reserve os resultados para examina-los em um capftulo posterior. 

18.12. Considere a identidade macroeconomica: 

C + I = Y (= PIB) 

Como anteriormente, imagine que 

Ct = A) + A Yt + u t 

e, seguindo o modelo do acelerador macroeconomico, fay a: 

I, = «o + oii(Y t - Y t - 1 ) + v t 

em que u e v sao termos de erro. Com base nos dados do Exercfcio 18.10, estime o modelo 
acelerador e reserve os resultados para estudos posteriores. 

18.13. Demanda e oferta de gasolina. ATabela 18.3, que se encontra no site do livro, fornece dados 
sobre algumas das variaveis que determinam a demanda e a oferta de gasolina nos Estados 
Unidos entre janeiro de 1978 e agosto de 2002. As variaveis sao: preyo da gasolina (centa¬ 
vos por galao); quantidade de gasolina (milhares de barris diarios, sem chumbo); renda pes- 
soal (bilhoes de dolares); vendas de carros (mi I hoes de carros por ano). 

a. Elabore um modelo MQO de oferta e demanda para o consumo de gasolina. 

b. Quais as variaveis endogenas e exogenas no modelo (a)? 

c. Se voce estimar as funyoes de demanda e oferta, desenvolvidas por voce por meio dos 
MQO, seus resultados serao confiaveis? Por que? 

d. Guarde as estimativas MQO de suas funyoes de demanda e oferta para retoma-las apos discu- 
tirmos o Capftulo 20. 

18.14. ATabela 18.4, encontrada no site do livro, oferece dados macroeconomicos sobre diversas 
variaveis para a economia americana nos trimestres 1951-1 a 2000-IV. 1 As variaveis sao as 
seguintes: Ano — data; Tri — trimestre; PIBR — PIB real (bilhoes de dolares); GCR — gastos 
com consumo real; IRSP — investimento real do setor privado; DRG — despesa real do go- 
verno; RPDR — renda pessoal disponfvel real; IPCJJ = fndice de preyos ao consumidor; 
Ml = estoque nominal de moeda; TLT = media trimestal da taxa de letras do Tesouro de final 
do mes dos ultimos 90 dias; Pop — populayao, em milhoes (interpolar os numeros do final do 
ano utilizando a taxa de crescimento constante por trimestre); Infl — taxa de inflayao (a pri- 
meira observayao foi perdida); e TJP — taxa de juros real posterior = TLT-Infl (a primeira 
observayao foi perdida). 

Utilizando-se esses dados, elabore um modelo macroeconomico simples da economia 
norte-americana. Voce devera avaliar esse modelo no Capftulo 20. 


* Esses dados foram extrafdos do site de SCHMIDT, Stephen J. Econometrics. Nova York: McGraw-Hill, 2005. Veja: www. 
mhhe.com/economics. 

t Esses dados pertencem originalmente ao Department of Commerce, Bureau of Economic Analysis; eles 
foram extrafdos de www.economagic.com e reproduzidos por Greene, William H. Econometric analysis. 6. ed. 
2008, Tabela F5.1, p.1.083. 




O problema da 
identificagao 

Neste capitulo, consideramos a natureza e o significado do problema da identificagao. O ponto 
central do problema de identificagao e o seguinte: retomar o modelo de oferta e demanda introduzido 
na Segao 18.2. Suponha que tenhamos dados apenas da serie temporal Qe P e nenhuma informagao 
adicional (como renda do consumidor, prego vigente no perfodo previo e condigoes climaticas). O 
problema da identificagao consiste em procurar uma resposta para esta pergunta: oferecidos apenas 
os dados de P e Q, como saberemos se estamos estimando a fungao demanda ou a fungao oferta? 
Como alternativa, se pensarmos que estamos ajustando uma fungao demanda, como garantiremos 
que ela e, de fato, a fungao demanda que estimamos e nao outra coisa qualquer? 

Um momento de reflexao revelara que uma resposta a pergunta anterior e necessaria antes que 
alguem resolva estimar os parametros de nossa fungao demanda. Neste capitulo, demonstraremos 
como o problema da identificagao e resolvido. Primeiro, introduziremos algumas poucas notagoes e 
definigoes e, entao, ilustraremos o problema da identificagao com varios exemplos. Isso sera seguido 
de regras que podem ser utilizadas para descobrir se uma equagao em um modelo de equagao simul- 
tanea esta identificada, isto e, se corresponde a relagao que realmente estamos estimando, seja ela a 
fungao demanda ou fungao oferta ou ainda outra coisa qualquer. 


19.1 


Notagoes e definigoes 


Para facilitarmos nossa discussao, introduziremos as seguintes notagoes e definigoes. 

O modelo geral de M equagoes com M endogenas, ou conjuntamente dependentes, pode ser escri- 
to como a Equagao (19.1.1): 

Y\t = PnY2t + + ■ • • + PimYmi 

+ YnX\ t + YnXit + —t- YikXki + «i/ 

Yit = Pl\Y\ t + ^23^31 +-f PimYmi 

+ Yl\X\t + Y22%2t + ••• + Y2K^Kt + U2t 

Yy = Pi\Yu + P32Y21 + —l- ft mYmi (19.1.1) 

+ YilXu + Y22^2t + -I - YiK^Kt + M 3 1 


YmT ~ Pm\Yu + p M2 Y2t + 1 - PmM-iYm-U 

+ YMlXlt + YM2^2t + • • • + YMkXki + UMt 


em que K,, Y 2 ,.. . , Y M — M variaveis endogenas ou conjuntamente dependentes 

X { , X 2 ,... , X K = K variaveis predeterminadas (uma dessas variaveis X pode ser igual a 
1 para permitir o termo de intercepto em cada equagao) 
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U\, « 2 > • • ■ > u M = M numero total de observagoes de disturbios estocasticos 
t = 1,2 ,T — numero total de observagoes 
P — coeficientes das variaveis endogenas 
Y = coeficientes das variaveis predeterminadas 


Observe que nem toda variavel precisa aparecer em cada equagao. De fato, vemos na Segao 19.2 
que isso nao deve acontecer se uma equagao puder ser identificada. 

Como mostra a Equagao (19.1.1), as variaveis que introduzem urn modelo de equagao simultanea 
sao de dois tipos: endogenas, isto e, aquelas (cujos valores sao) determinadas no modelo; e predeter¬ 
minadas, isto e, aquelas (cujos valores sao) determinadas fora do modelo. As variaveis endogenas sao 
tratadas como estocasticas, enquanto as predeterminadas sao tratadas como nao estocasticas. 

As variaveis predeterminadas dividem-se em duas categorias: exogenas, as quais podem ser cor- 
rentes ou defasadas e endogenas defasadas. Entao, X u e uma variavel exogena (do tempo presente), 
enquanto X 1( -f_y e uma variavel exogena defasada, com uma defasagem em um perfodo de tempo. 
Y(t-\) e uma variavel endogena defasada com uma defasagem em um perfodo de tempo, mas, posto 
que o valor de y 1( ,_y e conhecido no momento atual t, ele e observado como nao estocastico, sendo, 
portanto, uma variavel predeterminada. 1 Em resumo, variaveis exogenas correntes, exogenas defasa¬ 
das e endogenas defasadas sao consideradas predeterminadas; seus valores nao sao determinados 
pelo modelo no perfodo atual. 

E tarefa do formulador do modelo especificar quais variaveis sao endogenas e quais sao prede¬ 
terminadas. Embora variaveis (nao economicas) como temperatura e chuvas sejam claramente exo¬ 
genas ou predeterminadas, o formulador do modelo deve ter grande cuidado na classificagao de 
variaveis economicas como endogenas ou predeterminadas: ele deve defender a classificagao com 
bases teoricas ou aphoristic as. Mais a frente, neste capftulo, forneceremos um teste estatfstico de 
exogeneidade. 

As equagoes que aparecem em (19.1.1) sao conhecidas como estruturais ou comportamentais, 
porque podem retratar a estrutura (de um modelo economico) de uma economia ou o comportamento 
de um agente economico (por exemplo, consumidor ou produtor). Os /fey sao conhecidos como 

parametros estruturais ou coeficientes. 

Com base nas equagoes estruturais, pode-se solucionar as variaveis endogenas M e derivar as 
equagoes de forma reduzida e os coeficientes de forma reduzida associados. Uma equagao de 
forma reduzida e aquela que expressa uma variavel endogena apenas em termos das variaveis 
predeterminadas e os disturbios estocasticos. Para ilustrar, considere o modelo keynesiano de de- 
terminagao de renda que apresentamos no Capitulo 18: 


Fungao consumo: C t = /3 q + /3\Y, + u t 0 < f>\ < 1 


( 18 . 2 . 3 ) 


Iclentidade de renda: Y t = C t + I t 


( 18 . 2 . 4 ) 


Nesse modelo, C (consumo) e Y (renda) sao as variaveis endogenas e I (gasto com investimento) 
e considerada uma variavel exogena. Ambas as equagoes sao estruturais, de modo que a Equagao (18.2.4) 
e uma identidade. Como normalmente ocorre, presumimos que o /3 h o PMC, fique entre 0 e 1. 

Se a Equagao (18.2.3) for substitufda pela Equagao (18.2.4), obteremos, apos manipulagao alge- 
brica simples. 


Yf — n 0 + nj, + Wt 


( 19 . 1 . 2 ) 


1 Supomos implicitamente aqui que os disturbios estocasticos, os u, estao serialmente nao correlacionados. Se 
esse nao for o caso, Y t _^ sera correlacionado com o termo de erro do perfodo corrente u t . Portanto, nao pode- 
mos trata-lo como predeterminado. 
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em que 


n 0 = 


/So 


n. 


w, = 


1- A 

1 

1- j8i 

1 - /Si 


( 19 . 1 . 3 ) 


A Equapao (19.1.2) e uma equapao na forma reduzida; ela expressa a variavel endogena Y ape- 
nas como uma funpao da variavel exogena I (ou predeterminada) e do termo de disturbio estocastico 
u. n 0 e FEj sao os coeficientes associados na forma reduzida. Observe que esses coeficientes na 
forma reduzida sao combinapoes nao lineares do(s) coeficiente(s) estrutural(is). 

Ao substituirmos o valor Y da Equapao (19.1.2) por C da Equapao (18.2.3), obteremos outra 
equapao na forma reduzida: 


em que 


C t — U 2 + n 3 /, + w t 


n 2 = 


—— n 3 = —— 

1 - /Sr 1 - >Sj 


W t = 


U t 

I-/61 


( 19 . 1 . 4 ) 


( 19 . 1 . 5 ) 


Os coeficientes na forma reduzida, como FE 3 e n 3 , sao tambem conhecidos como multiplicado- 
res de impacto ou de curto prazo, porque medem o impacto imediato sobre a variavel endogena de 
uma mudanpa de unidade no valor da variavel exogena. 2 Se, no modelo keynesiano anterior, o gasto 
com investimento e aumentado por, por exemplo, $ 1, e se o PMC presume-se ser 0,8, entao da Equa¬ 
pao (19.1.3) obtemos n, = 5. Esse resultado significa que aumentar o investimento em $ 1 imediata- 
mente levara (isto e, no perfodo de tempo atual) a um aumento na renda de $ 5, isto e, um aumento 
quintuplicado. De forma semelhante, sob as condipoes presumidas, a Equapao (19.1.5) mostra que 
n 3 = 4, significando que o aumento de $ 1 no gasto em investimento levara imediatamente a um 
aumento de $ 4 no gasto em consumo. 

No contexto dos modelos econometricos, equapoes como a (18.2.4) ou Q‘j = Q] (quantidade 
demandada igual a quantidade ofertada) sao conhecidas como condigoes de equilibria. A identidade 
(18.2.4) afirnia que a renda agregada Y deve ser igual ao consumo agregado (isto e, o gasto em con¬ 
sumo mais o gasto em investimento). Quando o equilfbrio e atingido, as variaveis endogenas assu- 
mem seus valores de equilfbrio. 3 

Observe uma caracterfstica interessante das equapoes de forma reduzida. Visto que apenas as va¬ 
riaveis predeterminadas e os disturbios estocasticos aparecem nos lados direitos dessas equapoes e 
posto que as variaveis predeterminadas sao presumidas como nao correlacionadas com os termos de 
disturbio, o metodo MQO pode ser aplicado para estimar os coeficientes das equapoes de forma redu¬ 
zida (as Id). Com base nos coeficientes de forma reduzida estimados pode-se estimar os coeficientes 
estruturais (os /l), como mostrado anteriormente. Esse procedimento e conhecido como mmimos qua- 
drados indiretos (MQI), e os coeficientes estruturais estimados sao chamados de estimativas MQI. 


2 Nos modelos econometricos, as variaveis exogenas tern um papel crucial. Muito frequentemente, tais variaveis 
estao sob o controle direto do governo. Sao exemplos a taxa de impostos pessoais e corporativos, subsfdios, 
seguro-desemprego etc. 

3 Para mais detalhes, veja KMENTA, Jan. Elements of econometrics. 2. ed. Nova York: Macmillan, 1986. p. 723-731. 
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Estudaremos o metodo dos MQI em detalhes no Capftulo 20. Por enquanto, observe que, uma vez 
que os coeficientes de forma reduzida podem ser estimados pelo metodo dos MQO e uma vez que 
esses coeficientes sao combinafoes de coeficientes estruturais, existe a possibilidade de que os coefi¬ 
cientes estruturais possam ser “recuperados” por meio dos coeficientes de forma reduzida, e e a esti- 
macjao dos parametros estruturais que, em ultima analise, nos interessa. Como se podem recuperar os 
coeficientes estruturais por meio dos coeficientes de forma reduzida? A resposta e dada na Se?ao 
19.2, uma resposta que revela o ponto central do problema da identificac^ao. 


19.2 O problema da identifica^ao 

Por problema da identifica^ao entendemos a possibilidade de obter os parametros de uma equa- 
9 ao estrutural por meio dos coeficientes estimados na forma reduzida. Se isso puder ser feito, dizemos 
que a equagao particular e identificada. Do contrario, dizemos que a equa^ao em consideragao e nao 
identificada ou subidentficada. 

Uma equa?ao identificada pode tanto ser exatamente (ou completamente ou precisamente) identi¬ 
ficada ou sobreidentificada. Diz-se que e exatamente identificada se valores numericos exatos dos 
parametros estruturais podem ser obtidos. Diz-se ser sobreidentificada se mais do que um valor nu- 
merico pode ser obtido por alguns dos parametros das equa 9 oes estruturais. As circunstancias sob as 
quais cada um desses casos ocorre serao expostas em seguida. 

O problema da identificaqiao surge, porque diferentes grupos de coeficientes estruturais podem ser 
compatrveis com o mesmo grupo de dados. Em outras palavras, uma dada equagao de forma reduzida 
pode ser compatfvel com diferentes equa 9 oes estruturais ou diferentes hipoteses (modelos), e pode 
ser dificil afirmar qual hipotese especifica (modelo) estamos investigando. No restante desta se?ao, 
examinaremos varios exemplos para mostrar a natureza do problema da identifica^ao. 

Subidentifica^ao 

Considere mais uma vez o modelo de oferta e demanda (18.2.1) e (18.2.2), juntamente com o market- 
-clearing (condi^ao de equilfbrio de mercado), em que a demanda e igual a oferta. Pelo market-clearing , 
obtemos 


«0 + «i P t + U U - P\Pt + U2t 
Solucionando a Equa 9 ao (19.2.1), obtemos os pre 90 s de equilfbrio 

Pt - rio + v, 


em que 


n 0 


A) _ 

at - A 


Hit ~ Ult 

a\ ~ Pi 


( 19 . 2 . 1 ) 


( 19 . 2 . 2 ) 


( 19 . 2 . 3 ) 

( 19 . 2 . 4 ) 


Substituindo P, da Equa 9 ao (19.2.2) pela Equa 9 ao (18.2.1) ou (18.2.2), obtemos a seguinte quanti- 
dade de equilibrio: 


Q, - n t + w, 


( 19 . 2 . 5 ) 


em que 


n. 


UiPo ~ a oPi 


- Pi 


( 19 . 2 . 6 ) 
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Wt =°^L — P [Uu (19.2.7) 

ofi - Pi 

Observe que os termos de erro v f e w r sao combinagoes lineares dos termos de erro originais iq e m 2 . 

As Equagoes (19.2.2) e (19.2.5) sao equagoes na forma reduzida. Agora nosso modelo de oferta e 
demanda contem quatro coeficientes estruturais a Q , cq, /So e mas nao ha um caminho unico para 
estima-los. Por que? A resposta esta nos coeficientes de forma reduzida dados nas Equates (19.2.3) 
e (19.2.6). Esses coeficientes contem todos os quatro parametros estruturais, mas nao ha maneira pela 
qual as quatro incognitas estruturais possam ser estimadas com base apenas em dois coeficientes de 
forma reduzida. Lembre-se de que, na algebra do ensino medio, aprendemos que, para estimar quatro 
incognitas, devemos ter quatro equagoes (independentes) e, em geral, para estimar k incognitas, de- 
vemos ter k equagoes (independentes). Sendo assim, se executarmos a regressao na forma reduzida 
(19.2.2) e (19.2.5), veremos que nao ha variaveis explanatorias, apenas as constantes, e essas sim- 
plesmente fornecerao os valores medios de P e Q (por que?). 

O que tudo isso significa e que, apresentados os dados da serie temporal em P (prego) e Q (quan- 
tidade) e nenhuma outra informagao, nao ha outra forma de o pesquisador poder garantir se esta esti- 
mando a fungao demanda ou a fungao oferta. Isto e, um dado P, e um Q, representam o ponto de 
intersecgao das curvas de oferta e demanda apropriadas, porque a condigao de equilfbrio e que a de¬ 
manda seja igual a oferta. Isso pode ser observado com clareza no diagrama de dispersao exibido na 
Figura 19.1. 

A Figura 19. la apresenta poucos pontos de dispersao relacionando Q a P. Cada ponto de dispersao 
representa a intersecgao de uma curva de demanda e de oferta, como mostra a Figura 19.1 b. Agora 
considere um unico ponto, como o da Figura 19.1c. Nao ha como termos certeza sobre qual curva de 
oferta e demanda de toda uma famflia de curvas exibidas naquele painel gerou aquele ponto. Certa- 
mente alguma informagao adicional sobre a natureza das curvas de oferta e demanda faz-se necessa- 
ria. Por exemplo, se a curva de demanda desloca-se ao longo do tempo devido a mudanga na renda, 
gostos etc., mas a curva de oferta permanece relativamente estavel, como na Figura 19 Ad, os pontos 


FIGURA 19.1 

Fungdes hipoteticas 
de oferta e demanda e 
o problema da 
identificagao. 


0 



(a) 


( b ) 


(c) 
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de dispersao tragam uma curva de oferta. Nessa situagao, dizemos que a curva de oferta e identifica- 
da. Igualmente, se a curva de oferta muda ao longo do tempo devido as mudancas nas condigoes 
climaticas (no caso das commodities agricolas) ou outros fatores externos, mas a curva de demanda 
permanece relativamente estavel, como na Figura 19. le, os pontos de dispersao tragam uma curva de 
demanda. Nesse caso, dizemos que a curva de demanda e identificada. 

Ha uma alternativa e talvez uma maneira mais esclarecedora de observar o problema da identifi- 
cagao. Suponha que multipliquemos a Equagao (18.2.1) por 1(0 < 1 < 1) e a Equagao (18.2.2) por 
1—1 para obter as seguintes equagoes {observe: eliminamos os sobrescritos de Q ): 

XQ, = !a 0 + Xa x P t + Xu u (19.2.8) 

(1 - X)Q, = (1 - X)p 0 + (1 - 1)/Si P, + (1 - X)u 2 , (19.2.9) 

A soma dessas duas equagoes resulta na seguinte combinagao linear das equagoes de oferta e 
demanda originais: 


Qt= Vo + Y\Pt + w, (19.2.10) 

em que 

Vo = lao + (1 - X)Pq 

Y\ = Xa\ + (1 — X)/3\ (19.2.11) 

W t = Xu\, + (1 - X)u 2 t 

A equagao “falsa” ou “hfbrida” (19.2.10) e empiricamente indistinguivel tanto da Equagao (18.2.1) 
ou da Equagao (18.2.2), porque elas envolvem a regressao de Q e P. Se temos os dados da serie tem¬ 
poral emfe Q apenas, quaisquer das Equagoes (18.2.1), (18.2.2) ou (19.2.10) podem ser compariveis 
com os mesmos dados. Em outras palavras, os mesmos dados podem ser compariveis com as “hipo- 
teses” (18.2.1), (18.2.2) ou (19.2.10), e nao e possfvel dizer qual dessas hipoteses estamos testando. 

Para que uma equagao seja identificada, isto e, para que seus parametros sejam estimados, deve-se 
mostrar que o conjunto de dados apresentado nao produzira uma equagao estrutural que parega simi¬ 
lar, na aparencia, aquela na qual estamos interessados. Se passamos a estimar a fungao demanda, 
devemos mostrar que os dados oferecidos nao sao consistentes com a fungao oferta ou com alguma 
equagao hfbrida. 


Identifica^ao precisa ou exata 

Nao podemos identificar a fungao demanda ou a fungao oferta vista anteriormente, porque as mes- 
mas variaveis P c Q estao presentes em ambas as fungoes e nao ha informagao adicional, como indica- 
do na Figura 19.Id ou e. Mas suponha que consideremos o seguinte modelo de oferta e demanda: 

Fungao demanda: Q t — ao + ai P t + uil t + u\ t a\ < 0, a 2 > 0 ( 19 . 2 . 12 ) 

Fungao oferta: Qt = Po+ P\P, + uit P\ > ( 19 . 2 . 13 ) 

em que 1= renda do consumidor, uma variavel exogena, e todas as outras variaveis sao definidas como 
anteriormente. 

Perceba que a unica diferenga entre o modelo anterior e nosso modelo de oferta e demanda origi¬ 
nal e que ha uma variavel adicional na fungao demanda, em outras palavras, a renda. Com base na 
teoria economica da demanda, sabemos que a renda e normalmente um determinante importante da 
demanda para a maioria dos bens e servigos. Sua inclusao na fungao demanda dara alguma informagao 
adicional sobre o comportamento do consumidor. Para a maioria das commodities espera-se que a 
renda tenha um efeito positivo sobre o consumo (a 2 > 0). 

Por meio da condigao de equilfbrio, quantidade demandada = quantidade ofertada, temos 


ao + ct\P t + a 2 I t + U\t - Po + P\P t + u 2t 


( 19 . 2 . 14 ) 
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Solucionar a Equagao (19.2.14) fornece o seguinte valor de equilfbrio de P t : 

Pt = n 0 + n i i t + v t 


em que o coeficiente de forma reduzida e 


e 


n 0 


Po ~ «o 
oil - Pi 


ni 


oil 

a i - Pi 


nit ~ uit 

oil ~ Pi 


(19.2.15) 


(19.2.16) 


Substituindo o valor de equilfbrio de P, na fungao demanda precedente ou na fungao oferta, obte- 
mos a seguinte quantidade de equilibrio: 

Q, = V\ 2 + U 3 I t +w, (19.2.17) 


em que 


e 


n 2 = 
n 3 = 


w t = 


aiPo - a 0 Pi 

oil ~ Pi 
QiiPi 
oil ~ Pi 

oimit ~ Pmi, 

ai - Pi 


(19.2.18) 


Uma vez que (19.2.15) e (19.2.17) sao, ambas, equagoes na forma reduzida, o metodo de mfnimos 
quadrados ordinarios (MQO) pode ser aplicado para estimar seus parametros. Agora o modelo de 
oferta e demanda (19.2.12) e (19.2.3) contem cinco coeficientes estruturais — a 0 , a 2 , Pq e Pi - Mas 
ha apenas quatro equagoes para estima-los; em outras palavras, os quatro coeficientes de forma redu¬ 
zida n 0 , n j, n 2 , n 3 dados nas Equagoes (19.2.16) e (19.2.18). Portanto, uma unica solugao de todos 
os coeficientes estruturais nao e possivel. Contudo, pode-se mostrar que os parametros da fungao 
oferta podem ser identificados (estimados), porque 


Po — n 2 - PiU a 


Pi = 


n 3 
n. 


(19.2.19) 


Mas nao ha uma unica maneira de estimar os parametros da fungao demanda; ela permanece 
subidentificada. Observe que o coeficiente estrutural Pi e uma fungao nao linear dos coeficientes de 
forma reduzida, que coloca alguns problemas quando e necessario estimar o erro padrao da estimada 
Pi, como poderemos ver no Capftulo 20. 

Para verificarmos que a fungao demanda (19.2.12) nao pode ser identificada (estimada), vamos 
multiplica-la por /.(() < /. < 1) e (19.2.13) por 1 — k e soma-las para obter a seguinte equagao “hf- 
brida”: 


Qt = Yo + Yi Pt + Yih + w, 


( 19 . 2 . 20 ) 
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em que 

Vo = + (1 - k)Po 

Yi = kai + (1 - Wi (19.2.21) 

Y2 = Aq!2 
e 

W t = ku\t + (1 - k)u 2 t 

A equa 5 ao (19.2.20) e observacionalmente indistingufvel da fun 9 &o demanda (19.2.12) embora 
seja distingm'vel da fungao oferta (19.2.13), que nao contem a variavel I como uma variavel explana¬ 
tory. Portanto, a funqao demanda permanece nao identificada. 

Observe um fato interessante: e a presen^a de uma variavel adicional na fiincao demanda que 
nos habilita a identiflcar a fiincao oferta! Por que? A inclusao da variavel renda na equa 9 ao da 
demanda fornece-nos alguma informa 9 ao adicional sobre a variabilidade da funcao, como indicado 
na Figura 19. Id. Afigura mostra como a intersec?ao da curva de oferta estavel com a mudan^a da curva 
de demanda (por conta das mudangas na renda) habilita-nos a tragar (identiflcar) a curva de oferta. 
Como sera apresentado em breve, com frequencia a possibilidade de identiflcar uma equa^ao depen- 
de de ela excluir uma ou mais variaveis que estao incluldas em outras equa 9 oes no modelo. 

Mas consideremos o seguinte modelo de oferta e demanda: 

Fungao demanda: Q, = + a\P t + + U\ t oq < 0, 0:2 > 0 (19.2.12) 

Fungao oferta: Q, = p 0 + p x P t + faPt-i + u 2 , P\ > 0, > 0 (19.2.22) 

em que a fun 9 ao demanda permanece como antes, mas a fun 9 ao oferta inclui uma variavel explanatoria 
adicional, o pre 90 defasado em um perfodo. A fun 9 ao oferta postula que a quantidade de uma commodity 
ofertada depende do perfodo de pre 90 atual e previo, um modelo frequentemente utilizado para expli- 
car a oferta de muitas commodities agricolas. Observe que P t _\ e uma variavel predeterminada, porque 
seu valor e conhecido no perfodo t. 

Pelo mecanismo market-clearing, temos 

«o + oi\P t + oi 2 lt + u\ t = Po+ P\Pt + PiPt-\ + u 2 t (19.2.23) 

Solucionando essa equa 9 ao, obtemos o seguinte pre 90 de equilibrio: 

p, = n 0 + r hi t + n 2 P t -i + v t (19.2.24) 


em que 


n 0 = 


Po ~ «o 
a 1 - P\ 


n, 

n 2 


a 2 

oil ~ Pi 

P 2 

a\ ~ Pi 


uit ~ U\ t 
a\ - Pi 


(19.2.25) 


Substituindo o pre 90 de equilibrio na equa 9 ao de demanda ou de oferta, obtemos a corresponden- 
te quantidade de equilibrio: 


Qt - n 3 + 114/, + n 5 ?Vi + w t 


( 19 . 2 . 26 ) 
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em que os coeficientes de forma reduzida sao 


n 3 = 

OtlPo - OloP 1 


«1 - Pi 


n 4 = 

OllPl 

01 1 - pi 

(19.2.27) 

n 5 = 

OllPl 


oil - Pi 



0i\u lt - PiUu 
w, = - -Z - 

0-1 - Pi 

O modelo de oferta e demanda apresentado nas Equa£oes (19.2.12) e (19.2.22) contem seis 
coeficientes estruturais — a 0 , ot 2 , Pq, Pi e P 2 — e ha seis coeficientes de forma reduzida — n 0 , 
n b n 2 , n 3 , n 4 e n 5 —para estima-los. Os parametros de ambas as equagoes de oferta e demanda 
podem ser identificados e o sistema como um todo pode ser identificado. (No Exercicio 19.2, soli- 
cita-se que o leitor expresse os seis coeficientes estruturais em termos dos seis coeficientes de for¬ 
ma reduzida dados previamente para mostrar que a estimativa unica do modelo e posstvel.) 

Para verificarmos como as fun?oes de oferta e demanda anteriores sao identificadas, podemos 
tambem recorrer ao artiftcio de multiplicar a equa£ao de demanda (19.2.12) por /, (0 < /. < I ) e a 
equa£ao de oferta (19.2.22) por 1 — X e soma-las para obter uma equagao hfbrida. Essa equa£ao con¬ 
tent as variaveis predeterminadas I, e P ,; portanto, ela sera observacionalmente diferente tan to da 
demanda quanto da equa§ao de oferta, porque a anterior nao contem P t _ x e as ultimas nao contem /,. 


Superidentificagao 

Para certos bens e serv^os, a renda e a riqueza do consumidor sao importantes determinantes 
da demanda. Vamos modificar a funfao demanda (19.2.12) como se segue, mantendo a fungao 
oferta como antes: 

Fungao demanda: Qt = “o + aq Pi + <^ 2 I, + a 2 R, + u\ t (19.2.28) 

Fungao oferta: Qt = Po+ P\Pt + PiPt-i + « 2 ; (19.2.22) 

em que, alem das variaveis ja definidas, R representa riqueza; para a maioria dos bens e serv^os, es- 
pera-se que a riqueza (bem como a renda) tenha um efeito positivo sobre o consumo. 

Igualando demanda e oferta, obtemos o prepo e a quantidade de equilibrio seguintes: 


p, - n 0 + rii/, + u 2 r, + n3/)_ i + v, 
Qt — n 4 + n 5 i, + rigf?, + rivTv i + w t 

em que 


Po - «0 

rii = 

oil 

01 1 - pi 

oil - Pi 

Oil 

n 3 = 

Pi 

01 1 - Pi 

Oil - Pi 

0 ' 1 /So - oioPi 

n 5 = 

OllPl 

Oil ~ Pi 

011 - Pi 

0'3/Si 

n 7 = 

OllPl 

a x - Pi 

Oil - Pi 

aiu 2t ~ Piu\ t 

V t = 

Ult - Ml t 

O'! - Pi 

Oil - Pi 


(19.2.29) 

(19.2.30) 


(19.2.31) 
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O modelo de oferta e demanda anterior contem sete coeficientes estruturais, mas ha oito equates 
para estima-los — os oito coeficientes de forma reduzida dados na Equagao (19.2.31); isto e, o niime- 
ro de equagdes e maior do que o numero de incognitas. Como resultado, uma unica estimativa de 
todos os parametros de nosso modelo nao e possivel, o que pode ser facilmente demonstrado. Por 
meio dos coeficientes de forma reduzida, podemos obter 

(19.2.32) 

A12 

OU 

0, = ^ (19.2.33) 

Hi 

isto e, ha duas estimativas de coeficiente de prego na fungao oferta, e nao ha garantia de que esse dois 
valores ou solugoes serao identicos. 4 Alem disso, uma vez que /l, aparece nos denominadores de todos 
os coeficientes de forma reduzida, a ambiguidade na estimagao de />, sera transmitida para outras es¬ 
timativas tambem. 

Por que a fungao oferta foi identificada no sistema (19.2.12) e (19.2.22), mas nao no sistema 
(19.2.28) e (19.2.22), embora em ambos os casos a fungao oferta permanega a mesma? Aresposta e 
que temos “muita” informagao, ou excesso de informagoes, para identificar a curva de oferta. Essa 
situagao e o oposto do caso da subidentificagao, na qual ha muito pouca informagao. O excesso de 
informagao resulta do fato de que no modelo (19.2.12) e (19.2.22) a exclusao da variavel renda por 
meio da fungao oferta era o suficiente para identifica-la, mas no modelo (19.2.28) e (19.2.22) a fungao 
oferta exclui nao apenas a variavel renda mas tambem a variavel riqueza. Em outras palavras, no ul¬ 
timo modelo inclmmos “muitas” restrigoes na fungao oferta ao requere-la para excluir mais variaveis 
do que o necessario para identifica-la. Contudo, essa situagao nao implica que a superidentificagao 
seja necessariamente ma, porque veremos no Capftulo 20 como podemos lidar com o problema do 
excesso de informagao ou do excesso de restrigoes. 

Agora ja vimos todos os casos. Como a discussao anterior mostra, uma equagao em um modelo de 
equagao simultanea pode ser subidentificada ou identificada (tanto super como exatamente). O mo¬ 
delo como um todo e identificado se cada equagao nele e identificada. Para assegurarmos a identifi¬ 
cagao, langamos mao das equagdes de forma reduzida. Mas, na Segao 19.3, consideraremos uma 
alternativa e talvez um metodo mais rapido para determinar se uma equagao em um modelo de equa¬ 
gao simultanea e ou nao identificada. 


19.3 Regras para a identificagao 


Como demonstram os exemplos na Segao 19.2, em princfpio e possivel utilizar-se de equagdes de 
forma reduzida para determinar a identificagao de uma equagao em um sistema de equagdes simulta¬ 
neas. Mas esses exemplos tambem mostram quanto o processo pode ser trabalhoso e demorado. Fe- 
lizmente, nao e essencial utilizar tal procedimento. As chamadas condigoes de posto de identificagao 
auxiliam na tarefa ao fornecer uma rotina sistematica. 

Para entendermos as condigoes de posto, introduzimos as seguintes notagoes: 

M — numero de variaveis endogenas no modelo 
m — numero de variaveis endogenas em uma dada equagao 
K — numero de variaveis predeterminadas no modelo, incluindo o intercepto 
k — numero de variaveis predeterminadas em uma dada equagao 


4 Note a diferenga entre sub e superidentificagao. No caso anterior, e impossfvel obter estimativas dos parametros 
estruturais, enquanto no ultimo caso podem haver muitas estimativas de um ou mais coeficientes estruturais. 
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A condicao de posto de identificagao 5 

Uma condigao de identificagao necessaria (mas nao suficiente), conhecida como condicao de 
posto, pode ser enunciada de duas formas diferentes, mas equivalentes, como a seguir (a condicao 
de identificagao necessaria, bem como suficiente, sera apresentada mais a frente): 


Definigao 19.1 Em um modelo de M equagoes simultaneas, para que uma equagao seja identificada, 

deve-se excluir ao menos M — 1 das variaveis (endogenas e tambem predeterminadas) que 
aparecem no modelo. Se excluirmos exatamente M — 1 das variaveis, a equagao sera iden¬ 
tificada. Se excluirmos mais do que M — 1 variaveis, ela sera superidentificada. 


Definigao 19.2 Em um modelo de M equagoes simultaneas, para que uma equagao seja identificada, 

o numero de variaveis predeterminadas exclufdas da equagao nao deve ser menor do 
que o numero de variaveis endogenas inclufdas naquela equagao menos 1, isto e, 

K - k > m- 1 (19.3.1) 

Se K — k = m — 1, a equagao e, assim, identificada, mas, se K — k > m — 1, ela e superidentificada. 


No Exercicio 19.1, solicitamos ao leitor que prove que as duas definigoes anteriores de identifica¬ 
gao sao equivalentes. 

Para ilustrarmos a condigao de posto, voltemos aos nossos exemplos anteriores. 


EXEMPLO 19.1 Fungao demanda: Qf = «o+ a-\P t + Uu (18.2.1) 

Fungao oferta: Q\ = p 0 + faP t + u 2t (18.2.2) 

Este modelo possui duas variaveis endogenas P e Q e nenhuma variavel predeterminada. 
Para serem identificadas, cada uma das equagoes deve excluir ao menos a variavel M — 1 = 1. 
Uma vez que nao e esse o caso, nenhuma equagao e identificada. 


EXEMPLO 19.2 Fungao demanda: Qf = «o+ aiPt+ uih + wit (19.2.12) 

Fungao oferta: Q s t = /S 0 + p-\P t + u 2t (19.2.13) 

Neste modelo Q e P sao endogenas e / e exogena. Aplicando a condigao de posto dada 
na Equagao (19.3.1), vemos que a fungao demanda nao e identificada. Por outro lado, a 
fungao oferta e identificada, porque exclui exatamente a M — 1 =1 variavel, l t . 


EXEMPLO 19.3 Fungao demanda: Qf = ao+ ai P t + «2 It + uu (19.2.12) 

Fungao oferta: Qf = / 8 o+ fi-\Pt+ fcPt -1 + u 2t (19.2.22) 

Dado que P t e Q t sao endogenas e l t e P t _ i sao predeterminadas, a Equagao (19.2.12) 
exclui exatamente uma variavel P t _-\ e a Equagao (19.2.22) tambem exclui exatamente uma 
variavel l t . Portanto cada equagao e identificada pela condigao de posto. O modelo como um 
todo e identificado. 


5 0 termo ordem refere-se a ordem de uma matriz, isto e, o numero de linhas e colunas presentes em uma ma- 
triz. Veja o Apendice B. 
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EXEMPLO 19.4 Fungao demanda: Qf = ao+ ot\Pt + a 2 It + oiiRt + ifit (19.2.28) 

Fungao oferta: Q s t = p 0 + PiP t + p 2 P t -t + u 2t (19.2.22) 

Neste modelo P t e Q t sao endogenas e l t , R t e P t _i sao predeterminadas. A fungao deman¬ 
da exclui exatamente uma variavel P t _ , e, portanto, pela condigao de posto ela e exatamente 
identificada. Mas a fungao oferta exclui duas variaveis l t e R t e, desse modo, ela e sobreiden- 
tificada. Como observado anteriormente, neste caso ha duas formas de estimar /fi, o coefi- 
ciente da variavel prego. 

Observe aqui uma pequena complicagao. Pela condigao de posto, a fungao demanda e 
identificada. Mas, se tentarmos estimar os parametros dessa equagao com base nos coefi- 
cientes de forma reduzida dados na Equagao (19.2.31), as estimativas nao serao unicas, 
porque fa , utilizado nos calculos, engloba dois valores e devemos decidir qual deles e apro- 
priado. Essa dificuldade pode ser eliminada, porque, conforme demonstrado no Capitulo 20, 
em casos de superidentificagao, o metodo de mfnimos quadrados indiretos nao e apropriado 
e deve ser descartado em favor de outros. Um deles e o dos minimos quadrados em dois 
estagios, que discutiremos amplamente no Capftulo 20. 


Como mostram os exemplos anteriores, a identificagao de uma equagao em um modelo de 
equagoes simultaneas e posslvel se essa equagao exclui uma ou mais variaveis presentes em 
outras equagoes do modelo. Essa situagao e conhecida como criterio de exclusao (de variaveis) ou 
criterio de restrigoes zero (os coeficientes de variaveis que nao aparecem em uma equagao sao 
considerados com valores zero). Esse criterio e o metodo mais utilizado para assegurar ou de- 
terminar a identificagao de uma equagao. Entretanto, note que o criterio de restrigoes zero e 
baseado em uma expectativa a priori ou teorica de que certas variaveis nao aparecem em deter- 
minada equagao. Depende do pesquisador explicar claramente porque ele espera que certas 
variaveis aparegam em algumas equagoes e nao em outras. 

A condigao de posto de identificagao 6 

A condigao de posto discutida anteriormente e necessdria mas nao suficiente para a identificagao; 
mesmo se for satisfeita, pode acontecer de uma equagao nao ser identificada. No Exemplo 19.2, a equagao 
da oferta foi identificada pela condigao de posto porque excluiu a variavel renda I t , que apareceu na fun¬ 
gao demanda. Mas a identificagao so ocorrera se apenas a 2 , o coeficiente de I, na fungao demanda, nao 
for zero, isto e, se a variavel renda nao so provavelmente, mas de fato introduzir a fungao demanda. 

Em um sentido amplo, mesmo se a condigao de posto K — k> m — 1 e satisfeita por uma equa¬ 
gao, ela nao pode ser identificada, pois as variaveis predeterminadas excluidas desta equagao, mas 
presentes no modelo, podem nao ser todas independentes para que nao possa haver a corresponden- 
cia uma a uma entre os coeficientes estruturais (os /3) e os coeficientes de forma reduzida (o n). 
Em outras palavras, nao somos capazes de estimar os parametros estruturais dos coeficientes de 
forma reduzida, como demonstraremos em breve. Precisamos de uma condigao que seja necessa- 
ria e suficiente para a identificagao. Isso e fornecido pela condigao de posto de identificagao , que 
podemos estabelecer da seguinte forma: 


A condigao de Em um modelo que contenha M equagoes em M variaveis endogenas, uma equagao e 

posto de identificada se, e apenas se, ao menos um determinante diferente de zero de ordem (M — 1) 

identificagao (M — 1) puder ser construido por meio dos coeficientes das variaveis (tanto endogenas quan¬ 

to predeterminadas) excluidas da equagao especificada, mas incluidas em outras equagoes 
do modelo. 


6 0 termo posto refere-se ao posto de uma matriz e e dado pela maior matriz de ordem quadrada (contida na 
matriz apresentada) cujo determinante e nao zero. Por outro lado, o posto de uma matriz e o maior numero de 
linhas ou colunas linearmente independentes daquela matriz. Veja o Apendice B. 
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Como uma ilustragao da condipao de posto de identificaqao, considere o seguinte sistema de equa- 
qoes simultaneas no qual as variaveis Y sao endogenas e as X, predeterminadas. 7 

Y\ t ~ @10 - @nY 2 t — PnYit — YnXit = u\ t (19.B.2) 

Yi t ~ @20 ~ P 23 Y 3 , - Y 2 \Xu - Y 22 X 21 = U 2 t (19.B.3) 

Y?,t ~ @30 ~ @31 Y\ t - Y3\X\t ~ YnXit - u-st (19.3.4) 

Ym~ @40 - @41 Y\t - @42Y2t ~Y43^2t = «4l (19.3.5) 


Para facilitarmos a identificapao, vamos escrever o sistema anterior na Tabela 19.1, o qual e autoexpli- 
cativo. 

Primeiro, aplicaremos a condiqao de posto de identificapao, como exibido na Tabela 19.2. Pela 
condiqao de posto, cada equaqao e identificada. Vamos checar novamente com a condipao de posto. 
Considere a primeira equa§ao, que exclui as variaveis Y 4 , X 2 e X 2 (isso e representado pelos zeros na 
primeira linha da Tabela 19.1). Para essa equaqao ser identificada, devemos obter ao menos um de- 
terminante nao zero de ordem 3X3 dos coeficientes das variaveis excluidas dessa equapao, mas in- 
clufda em outras equa 9 oes. Para obter o determinante, primeiro obtemos a matriz relevante dos 
coeficientes das variaveis Y 4 , X 2 e X 3 inclufdas nas outras equa 9 oes. Neste caso, ha apenas uma matriz 
desse tipo, chamada A, definida assim: 


A = 


-0 

0 

.1 


-K22 

~Y32 

0 


0 - 
0 

- K43 - 


Pode-se ver que o determinante desta matriz e zero: 


det A = 


0 - Y 22 

0 - Y32 

1 0 


0 

0 

_ K43 


(19.3.6) 


(19.3.7) 


Uma vez que o determinante e zero, o posto da matriz (19.3.6), estipulado por p(A), e menor do 
que 3. Entao, a Equa 9 ao (19.3.2) nao satisfaz a condipao de posto e, portanto, nao e identificada. 


TABELA 19.1 


Coeficientes das variaveis 


Equagao N a 

1 

Yi 

Y 2 

Y3 

Y4 

*1 

X 2 

X3 

(19.3.2) 

-/ho 

1 

-@u 

~ @13 

0 

-Yu 

0 

0 

(19.3.3) 

- @20 

0 

1 

— @23 

0 

~Y2 1 

-722 

0 

(19.3.4) 

~ @30 

- @31 

0 

1 

0 

— Y31 

- 732 

0 

(19.3.5) 

“ @40 

~ @41 

“ @42 

0 

1 

0 

0 

-743 


TABELA 19.2 

N e de variaveis 

N a de variaveis 


Equagao n a 

predeterminadas excluidas 

endogenas inclufdas 

Identificada? 


(K-k) 

menos uma, (m - 1) 


(19.3.2) 

2 

2 

Exatamente 

(19.3.3) 

1 

1 

Exatamente 

(19.3.4) 

1 

1 

Exatamente 

(19.3.5) 

2 

2 

Exatamente 


z O sistema de equajoes simultaneas, apresentado na Equagao (19.1.1), pode ser demonstrado da seguinte forma 
alternativa, que pode ser conveniente para as manipulagoes da matriz. 
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Como observado, a condigao de posto e necessaria e suficiente para a identificagao. Sendo as- 
sim, embora a condigao de posto mostre que a Equagao (19.3.2) e identificada, a condigao de 
posto mostra que ela nao e. Aparentemente, as colunas ou linhas da matriz A dadas na Equagao 
(19.3.6) nao sao (linearmente) independentes, significando que ha alguma relagao entre as varia- 
veis Y 4 , X 2 e X 2 . Como resultado, nao temos informagoes suficientes para estimar os parametros 
da Equagao (19.3.2); as equagoes de forma reduzida para o modelo anterior mostrarao que nao e 
possivel obter os coeficientes estruturais da equagao com base nos coeficientes na forma reduzida. 
O leitor deve verificar que, pela condigao de posto, as Equagoes (19.3.3) e (19.3.4) tambem nao 
sao identificadas, mas a (19.3.5) e. 

Como demonstra a discussao anterior, a condigao de posto nos diz se a equagao em consideragdo 
e identificada ou nao, enquanto a condigao de posto nos diz se ela e exatamente identificada ou su- 
peridentificada. 

Para aplicarmos a condigao de posto, podemos proceder da seguinte forma: 

1. Escreva o sistema em uma forma tabular, conforme apresentado na Tabela 19.1 

2. Cancele os coeficientes da linha em que a equagao em questao aparece. 

3. Cancele tambem as colunas correspondentes aos coeficientes no passo (2) que sao diferentes de 
zero. 

4. As entradas deixadas na tabela oferecerao, assim, apenas os coeficientes das variaveis incluidas 
no sistema, mas nao na equagao em consideragao. Dessas entradas forme todas as matrizes pos- 
sfveis, como A, de ordem M — 1 e obtenha os determinantes correspondentes. Se pudermos en- 
contrar pelo menos um determinante diferente de zero, a equagao em questao sera (exata ou 
super) identificada. O posto da matriz, por exemplo, A, neste caso e exatamente igual a M — 1. Se 
todas determinantes possfveis (M — 1 )(M — 1) sao zero, o posto da matriz A e menor que M — 1 
e a equagao sob investigagao nao e identificada. 

Nossa analise sobre as condigoes de posto de identificagao leva aos seguintes principios gerais de 
identificagao de uma equagao estrutural em um sistema de M equagoes simultaneas: 


I.Se/C— k> m — leo posto da matriz A e M — 1, a equagao e superidentificada. 

2. Se K — k = m — leo posto da matriz A e M — 1, a equagao e exatamente identificada. 

3. Se K — k> m — leo posto da matriz A e menor do que M — 1, a equagao e subidentificada. 

4. Se K— k < m — 1,a equagao estrutural nao e identificada. O posto da matriz A neste caso tende 
a ser menor do que M — 1 . (Por que?) 

De agora em diante, quando falarmos sobre identificagao queremos significar identificagao exata 
ou superidentificagao. Nao ha razao para considerar nao identificadas, ou subidentificadas, as equa¬ 
goes, porque nao importa quao extensa e a base de dados, os parametros estruturais nao podem ser 
estimados. Alem disso, a maioria dos sistemas de equagoes simultaneas em economia e finangas sao 
mais superidentificados do que subidentificados e, portanto, nao precisamos ficar muito preocupados 
com a subidentificagao. Contudo, como sera mostrado no Capitulo 20, os parametros das equagoes 
superidentificadas e exatamente identificadas podem ser estimados. 

Qual condigao deveriamos utilizar na pratica: ordem ou posto? Para grandes modelos de equagao 
simultanea, aplicar a condigao de posto e um risco formidavel. Entao, como Harvey observa, 

Felizmente, a condigao de posto e nonnalmente suficiente para assegurar a identificabilidade, e, embo¬ 
ra seja importante estar atento a condigao de posto, uma falha na verificagao dela raramente resulta em 
desastre. 8 


8 HARVEY, Andrew. 77ie econometric analysis of time series. 2. ed. Cambridge, Mass.: The MIT Press, 1990. p. 328. 
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*19.4 Um teste de simultaneidade 9 


Se nao ha equafoes simultaneas ou problema de simultaneidade, os estimadores MQO produ- 
zem estimadores consistentes e eficientes. Por outro lado, se ha simultaneidade, os estimadores MQO 
nao sao sequer consistentes. Na prcscnca da simultaneidade, como mostraremos no Capftulo 20, os 
metodos de minimos quadrados em dois estagios (MQ2E) e variaveis instrumentais (VI) ofere- 
cerao estimadores consistentes e eficientes. Curiosamente, se aplicarmos esses metodos alternatives 
quando nao ha de fato simultaneidade, estes nos oferecerao estimadores consistentes, mas nao efi¬ 
cientes (isto e, com menor variancia). Essa discussao sugere que devemos verificar o problema da 
simultaneidade antes de descartarmos os MQO em favor das alternativas. 


Como mostramos, o problema da simultaneidade surge, porque alguns dos regressores sao endo- 
genos e costumam ser correlacionados com o termo de disturbio ou erro. Para que um teste de simulta¬ 
neidade seja essencial, ele precisa definir se um regressor ( endogeno ) esta correlacionado com o 
termo de erro. Se assim o for, o problema da simultaneidade existira, no qual os casos alternativos aos 
MQO devem ser encontrados; do contrario, podemos utilizar os MQO. Para descobrirmos qual e o 
caso em uma situapao concreta, usemos o teste de espccificagao de erro de Hausman. 


Teste de especifica^ao de Hausman 

Uma versao do teste de especificafao de erro de Hausman, usada para testar o problema da 
simultaneidade, e explicada da seguinte maneira: 10 

Para ordenar as ideias, considere o modelo de duas equa£oes 


Fungao demanda: 

Qt - otQ + ot\P t + a 2 I t + ot 2 R t + u\ t 

(19.4.1) 

Fungao oferta: 

Q] - Po + Pi Pi + uit 

(19.4.2) 

em que P — pre 50 

Q — quantidade 

/ = renda 



R — riqueza 

u — termos de erro 




Presuma que I e R sejam exogenos; certamente, P e Q sao endogenos. 

Agora considere a fun 5 ao oferta (19.4.2). Se nao ha o problema da simultaneidade (isto e, P e Q 
sao mutuamente independentes), P, e u 2t deveriam ser nao correlacionados (por que?). Por outro lado, 
se houver simultaneidade, P, e u 2t serao correlacionados. Para descobrir qual e o caso, o teste de 
Hausman procede da seguinte maneira: 

Primeiro, das equates (19.4.1) e (19.4.2), obtemos as seguintes equapoes na forma reduzida: 

P t = n 0 + njt + n 2 r, + Vt (19.4.B) 

Qt— PI3 + n 4 / r + n 5 7C + w t ( 19 . 4 . 4 ) 

em que v e w sao os termos de erro na forma reduzida. Estimando a Equa 5 ao (19.4.3) por MQO, 
obtemos 

P t = n 0 + fli4+ fl 2 R t ( 19 . 4 . 5 ) 


*Opcional. 

9 A seguinte discussao foi extrafda de Robert S.; RUBINFELD, Daniel L. Econometric models and economic forecasts. 
3. ed. Nova York: McGraw-Hill, 1991. p. 303-305. 

10 HAUSMAN, J. A. "Specification tests in econometrics." Econometrica, v. 46, p. 1.251-1.271, nov. 1976. Veja 
tambem NAKAMURA, A.; NAKAMURA, M. "On the relationship among several specification error tests presen¬ 
ted by Durbin, Wu, and Hausman." Econometrica, nov. 1981. vol. 49, p. 1.583-1.588. 
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EXEMPLO 19.5 

Modelo de gasto 
publico de 
Pindyck- 
Rubinfeld 12 


Portanto, 

P t = P t +vt (19.4.6) 

em que P t sao estimadas, P, e v, sao os residuos estimados. Agora considere a seguinte equagao: 

Qt = Po + P\Pt + PiVt + U21 (19.4.7) 

Observe: os coeficientes de P, e v, sao os mesmos. A diferen 9 a entre essa equa 9 ao e a equa 9 ao de 
oferta original e que ela inclui a variavel adicional v t , o resfduo da regressao (19.4.3). 

Agora, se a hipotese nula e de que nao ha simultaneidade, isto e, P, nao e uma variavel endogena, 
a correla 9 ao entre v, e u 2t deve ser zero, assintoticamente. Entao, se procedermos com a regressao 
(19.4.7) e descobrirmos que o coeficiente de v r na Equa 9 ao (19.4.7) e estatisticamente zero, podemos 
concluir que nao ha problema de simultaneidade. Essa conclusao sera revertida se descobrirmos que 
esse coeficiente e estatisticamente significante. A proposito, observe que o teste de simultaneidade de 
Hausman e tambem conhecido como o teste de endogeneidade de Hausman: neste exemplo quere- 
mos descobrir se P, e endogeno. Se for, teremos o problema da simultaneidade. 

Essencialmente, entao, o teste de Hausman envolve os seguinte passos: 

Passo 1. Fa 9 a a regressao P, contra I, e R, para obter v t . 

Passo 2. Fa 9 a a regressao de Q, contra P, e v, e fa 9 a um teste t sobre o coeficiente de v,. Se for 

significante, nao rejeite a hipotese da simultaneidade; caso contrario, rejeite-a. 11 Para uma estima- 

9 ao eficiente, contudo, Pindyck e Rubinfeld sugerem a regressao de Q, contra P,e v,. 12 

Ha formas altemativas de aplicar o teste de Hausman, que serao apresentadas na forma de um 
exercfcio. 


Para estudar o comportamento dos gastos dos governos locais e estaduais dos Estados 
Unidos, os autores desenvolveram o seguinte modelo de equafoes simultaneas: 


EXP = jS-i + ^ 2 AID + ^ 3 INC + ^ 4 POP + u, 
AID = + 5 2 EXP + <S 3 PS + Vj 


em que 


EXP = gastos publicos dos governos locais e estaduais 
AID = transferences do governo federal 
INC = renda dos Estados 
POP = populafao do Estado 

PS = populafao de crianfas das escolas primarias e secundarias 
u e v = termos de erro 


( 19 . 4 . 8 ) 

( 19 . 4 . 9 ) 


Neste modelo, INC, POP e PS sao considerados variaveis exogenas. 

Em virtude da possibilidade da simultaneidade entre EXP e AID, os autores primeiramente 
fazem a regressao de AID contra INC e PS (isto e, a regressao da forma reduzida). Seja o ter- 
mo de erro nessa regressao w,. Por meio dessa regressao, o resfduo calculado e vv,. Os autores, 
entao, fazem a regressao de EXP contra AID, INC, POP e vv„ para obter os seguintes resultados: 


( Continua ) 


11 Se mais de um regressor endogeno estiver envolvido, teremos de usar o teste F. 
u PINDYCK e RUBINFELD, op. cit., p. 304. Nota: o regressor e P,e nao P t . 

13 PINDYCK e RUBINFELD, op. cit., p. 176-1 77. Notaries levemente alteradas. 
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EXEMPLO 19.5 EXP = - 89,41 + 4,50AID + 0,00013INC- 0,518POP- 1,39 w, 

(Continuagao) t= (-1,04) (5,89) (3,06) (-4,63) (-1,73) ( 19 . 4 . 10) 14 

R 2 = 0,99 

Se o nfvel de significancia estiver em 5%, o coeficiente de W; nao sera estatisticamente signi¬ 
ficative, e, portanto, para esse nfvel, nao havera problema de simultaneidade. Contudo, 
se o nfvel de significancia estiver em 10%, sera estatisticamente significativo, aumentan- 
do a possibilidade de que o problema de simultaneidade esteja presente. 

A estimagao dos MQO da Equagao (19.4.8) e como se segue: 


EXP = - 46,81 + 3,24AID + 0,00019INC- 0,597POP 

t= (-0,56) (13,64) (8,12) (-5,71) ( 19 . 4 . 11 ) 

R 2 = 0,993 

Perceba uma caracterfstica interessante dos resultados dados nas Equates (19.4.10) e 
(19.4.11): quando a simultaneidade e explicitamente levada em conta, a variavel AID e me- 
nos significante embora numericamente seja maior em grandeza. 


*19.5 Testes de exogeneidade 

Observamos que e responsabilidade do pesquisador especificar quais variaveis sao endogenas e 
quais sao exogenas. Isso dependera do problema que esta a mao e da informagao a priori que o pes¬ 
quisador tem. Mas e possfvel desenvolver um teste estatfstico de exogeneidade, a maneira do teste de 
causalidade de Granger? 

O teste de Hausman, discutido na Segao 19.4, pode ser utilizado para responder a essa questao. 
Suponha que tenhamos um modelo de tres equagoes nas tres variaveis endogenas, Y u Y 2 e Y 3 , e que 
haja tres variaveis endogenas, 2£j, X 2 e X :i . Alem disso, suponha que a primeira equa 5 ao do modelo 
seja 


Y\i - Po + faYii + PiY 2i + a\Xu + uu 


(19.5.1) 


Se Y 2 e Y 2 sao realmente endogenas, nao podemos estimar a Eiquayao (19.5.1) por MQO (por 
que?). Mas como descobrir isso? Podemos proceder do seguinte modo. Obtemos as equagoes da 
forma reduzida para Y 2 e Y 2 {Observe: as equagoes de forma reduzida terao apenas variaveis prede- 
terminadas no lado direito.) Com as equagoes da forma reduzida, obtemos Y 2i e Y 2i , os valores previs- 
tos de Y 2i e Y 3l , respectivamente. Entao, no espfrito do teste de Hausman, podemos estimar a 
seguinte equagao por MQO: 


Yu - Po + PiY 2 i + PiY 2 j + a\X\i + A.2 Y 2 j + X 3 f 3i + u\i (19.5.2) 


Utilizando o teste F, testamos a hipotese que 7-2 = /G = 0. Se a hipotese for rejeitada, Y 2 e Y 3 
poderao ser consideradas endogenas, do contrario, poderao ser tratadas como exogenas. Para um 
exemplo concreto, veja o Exercfcio 19.16. 


14 Como na nota de rodape 12, os autores utilizam AID em vez de AID como regressor. 
*Opcional. 
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Resumo e 
conclusoes 


EXERCICIOS 


1.0 problema da identifica 9 ao precede o problema da estimaqiao. 

2.0 problema da identificafao busca saber se podemos obter estimativas numericas tinicas dos 
coeficientes estruturais por meio dos coeficientes de forma reduzida estimados. 

3. Se isso puder ser feito, uma equa 9 ao em um sistema de equa 9 oes simultaneas e identificado. Do 
contrario, aquela equa 9 ao nao e identificada ou e subidentificada. 

4. Uma equa 9 ao identificada pode ser exatamente identificada ou superidentificada. No caso ante¬ 
rior, valores linicos de coeficientes estruturais podem ser obtidos; no ultimo caso, deve haver mais 
do que um valor para um ou mais parametros estruturais. 

5.0 problema da identifica 9 ao surge, porque o mesmo conjunto de dados pode ser compativel com 
diferentes conjuntos de coeficientes estruturais, isto e, diferentes modelos. Na regressao de pre 90 
contra a quantidade apenas, e diffcil dizer se alguem esta estimando a funcao oferta ou a fun 9 ao 
demanda, porque pre 90 e quantidade entram em ambas as equa 9 oes. 

6. Para avaliar a identifica 9 ao de uma equa 9 ao estrutural, pode-se aplicar a tecnica das equagdes de 
forma reduzida, que expressa uma variavel endogena apenas como uma fun 9 ao de variaveis 
predeterminadas. 

7. Entretanto, esse procedimento demorado pode ser evitado utilizando a cond^ao de posto ou 
a condigao de posto de identifica 9 ao. Embora a cond^ao de posto seja facil de aplicar, ela 
fornece apenas uma cond^ao necessaria para a identifica 9 ao. Por outro lado, a cond^ao de 
posto e tanto uma cond^ao necessaria quanto suficiente para a identifica 9 ao. Se a cond^ao 
de posto e satisfeita, a cond^ao de posto tambem o e, embora o inverso nao seja verdadeiro. 
Na pratica, a cond^ao de posto e geralmente adequada para assegurar a identificabilidade. 

8. Na presen 9 a da simultaneidade, os MQO em geral nao sao aplicaveis, como e apresentado no 
Capftulo 18. Mas se quisermos utiliza-la, e imperativo testar explicitamente a simultaneidade. O 
teste de especifica 9 ao de Hausman pode ser usado com esse proposito. 

9. Embora, na pratica, decidir se uma variavel e endogena ou exogena seja uma questao de julga- 
mento, pode-se utilizar o teste de especifica 9 ao de Hausman para determinar se uma variavel, ou 
grupo de variaveis, e endogena ou exogena. 

10. Embora sejam da mesma famflia, os conceitos de causalidade e exogeneidade sao diferentes e um 
nao pode necessariamente implicar o outro. Na pratica, e melhor manter esses conceitos separa- 
dos (veja a Se 9 ao 17.14). 


19.1. Mostre que as duas definiqoes da cond^ao de posto de identifica 9 ao (veja a Se 9 ao 19.3) sao 
equivalentes. 

19.2. Deduza os coeficientes estruturais com base nos coeficientes de forma reduzida apresentados 
nas Equa 9 oes (19.2.25) e (19.2.27). 

19.3. Obtenha a forma reduzida dos seguintes modelos e determine em qual caso as equa 9 oes estru¬ 
turais sao nao identificadas, exatamente identificadas ou superidentificadas: 

a. Capftulo 18, Exemplo 18.2. 

b. Capftulo 18, Exemplo 18.3. 

c. Capftulo 18, Exemplo 18.6. 

19.4. Verifique a identifica 9 ao dos modelos do Exercicio 19.3 ao aplicar tanto a cond^ao de posto 
quanto a cond^ao de posto de identifica 9 ao. 

19.5. No modelo (19.2.22) do texto, mostrou-se que a equa 9 ao da oferta foi superidentificada. Quais 
restri 9 oes, se houver alguma, nos parametros estruturais tornarao essa equa 9 ao exatamente 
identificada? Justifique as restri 9 oes impostas por voce. 
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19.6. Por meio do modelo 

Y\t = P\o + P\ 2 Y 2 t + YnX\ t + u\ t 
Y 2 t = P 20 + fi 2 l Y\t + Y 22 X 21 + U 2 t 

sao obtidas as seguintes equates na forma reduzida: 

Yu = n 10 + + T\\ 2 X2t + w t 

Y 2 t = n 20 + n 2 iZ u + n 22 x 2t + v t 

a. As equates estruturais sao identificadas? 

b. O que acontece com a identificaqao se sabemos a priori que y n — 10? 

19.7. Retome o Exerclcio 19.6. As equaqoes de forma reduzida sao as seguintes: 

Yu = 4 + 3X\ t + 8 X 2 t 
Fir = 2 + 6 X lt + 10X 2 , 

a. Obtenha os valores dos parametros estruturais. 

b. Como voce testaria a hipotese nula de que y u — 10? 

19.8. O modelo 

Fir = Pw + PnY 2l + YnXu + u\ t 
Yu = P 20 + PnY\t + u 2t 

produz as seguintes equaqoes de forma reduzida: 

Yu = 4 + 8AU 

F 2 ,= 2 + 12 X xt 

a. Quais coeficientes estruturais, se houver algum, podem ser estimados com base nos coe- 
ficientes de forma reduzida? Demonstre seu ponto de vista. 

b. Como a resposta a (a) muda se sabemos a priori que (1) fi l2 — 0 e (2) /3 10 = 0? 

19.9. Determine se as equaqoes estruturais do modelo dado no Exercicio 18.8 sao identificadas. 

19.10. Retome ao Exercicio 18.7 e descubra quais equaqoes estruturais podem ser identificadas. 

19.11. A Tabela 19.3 e um modelo com cinco equaqoes com cinco variaveis endogenas F e quatro 
variaveis exogenas X: 


TABELA 19.3 


Coefcientes das variaveis 


Equaqao n a 

Fi 

y 2 

Tb 

Y 4 

Ys 

*1 

*2 

*3 

X 4 

1 

1 

Pm 

0 

Pi a 

0 

711 

0 

0 

714 

2 

0 

1 

P 22 

P 24 

0 

0 

722 

723 

0 

3 

Pll 

0 

1 

Pl4 

PlS 

0 

0 

733 

734 

4 

0 

P 42 

0 

1 

0 

741 

0 

743 

0 

5 

1051 

0 

0 

PS4 

1 

0 

752 

753 

0 


Determine a identificaqao de cada equaqao com a ajuda das condiqoes de posto. 

19.12. Considere o seguinte modelo keynesiano estendido da determinaqao de renda: 


Fungao consumo: 

c t = 

Pl + ftFr - P 2 T, + Mir 

Fungao investimento: 

It = 

<*0 + OfiFr- 1 + u 2t 

Fungao tributagao: 

T,= 

Yo + 7i Y t + u 2t 

Identidade de renda: 

Fr = 

Cf + It + Gf 
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em que 


C — gastos com consumo 
Y = renda 
I = investimento 
T = impostos 
G = gastos governamentais 
u — termos de disturbio 


No modelo, as variaveis endogenas sao C, I, T e Y e as variaveis predeterminadas sao G e 

Y,-i- 

Ao aplicar a condi^ao de posto, verifique a identifica?ao de cada uma das equa 9 oes do siste- 
ma e do sistema como um todo. O que ocorreria se r,, a taxa de juros, supondo que seja 
exogena, aparecesse no lado direito da tuncao investimento? 

19.13. Retome aos dados indicados na Tabela 18.1 do Capltulo 18. Utilizando-os, estime as regres- 
soes de forma reduzida (19.1.2) e (19.1.4). Voce pode estimar /3 0 e Mostre seus calculos. 
O modelo e identificado? Por que? 

19.14. Suponha que seja proposta uma outra definifao de condiqiao de posto de identificaqiao: 

K > m + k - 1 

que afirme que o numero de variaveis predeterminadas no sistema nao possa ser menor que 
o numero de coeficientes desconhecidos na equac^ao a ser identificada. Mostre que essa identi- 
fica 9 ao e equivalente as duas outras defini 9 oes da condi 9 ao de posto apresentadas no texto. 

19.15. Uma versao simplificada do modelo de mercado de melancias de Suit e a seguinte: 

Equagao da demanda: P t = ao + ot\(Q t )N t ) + oi 2 (Y t )N t ) + a?,F t + u\ t 

Fungao oferta da safra: Q t = /So + P\(Pt) Wt) + PiPt -1 + \ + u^t 

em que P = pre 90 

(Q/N) — quantidade demandada per capita 
( YIN) — renda per capita 
F, — custos de frete 

{PI W) = preco em rela 9 ao aos salarios rurais 
C = pre 90 do algodao 
T — pre 90 de outras safras 
N = popula 9 ao 

P e Q sao as variaveis endogenas. 

a. Obtenha a forma reduzida. 

b. Determine se sao identificadas a fun 9 ao demanda, a fun 9 ao oferta ou ambas. 


Exercfcios aplicados 

19.16. Considere o seguinte modelo de demanda e oferta de moeda: 

Demanda de moeda: Mf = + j3\ Y t + faRt + faPt + u\t 

Oferta de moeda: M s t = a.Q + a.\Y t + 

em que M — moeda 
Y = renda 
R — taxa de juros 
P = preco 
it — termo de erro 


'SUITS, D. B. "An econometric model of the watermelon market." Journal of Farm Economics, 1955. v. 37, 
p. 237-251. 
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TABELA 19 4 







Observagao 

m 2 

PIB 

TBRATE 

IPC 








1970 

626,5 

3.771,9 

6,458 

38,8 

Juros e Indice de 

1971 

7 10,3 

3.898,6 

4,348 

40,5 

Pre§os ao Consumidor 

1972 

802,3 

4.105,0 

4,071 

41,8 

- 1970-2006 

1973 

855,5 

4.341,5 

7,041 

44,4 


1974 

902,1 

4.319,6 

7,886 

49,3 

the President, 2007, Tabelas 

1975 

1.016,2 

4.311,2 

5,838 

53,8 

B-2, B-60, B-69, B-73. 

1976 

1.152,0 

4.540,9 

4,989 

56,9 


1977 

1.270,3 

4.750,5 

5,265 

60,6 

1978 

1.366,0 

5.015,0 

7,221 

65,2 

1979 

1.473,7 

5.173,4 

10,041 

72,6 

1980 

1.599,8 

5.161,7 

11,506 

82,4 

1981 

1.755,5 

5.291,7 

14,029 

90,9 

1982 

1.910,1 

5.189,3 

10,686 

96,5 

1983 

2.126,4 

5.423,8 

8,63 

99,6 

1984 

2.309,8 

5.813,6 

9,58 

103,9 

1985 

2.495,5 

6.053,7 

7,48 

107,6 

1986 

2.732,2 

6.263,6 

5,98 

109,6 

1987 

2.831,3 

6.475,1 

5,82 

113,6 

1988 

2.994,3 

6.742,7 

6,69 

118,3 

1989 

3.158,3 

6.981,4 

8,12 

124,0 

1990 

3.277,7 

7.112,5 

7,51 

130,7 

1991 

3.378,3 

7.100,5 

5,42 

136,2 

1992 

3.431,8 

7.336,6 

3,45 

140,3 

1993 

3.482,5 

7.532,7 

3,02 

144,5 

1994 

3.498,5 

7.835,5 

4,29 

148,2 

1995 

3.641,7 

8.031,7 

5,51 

152,4 

1996 

3.820,5 

8.328,9 

5,02 

156,9 

1997 

4.035,0 

8.703,5 

5,07 

160,5 

1998 

4.381,8 

9.066,9 

4,81 

163,0 

1999 

4.639,2 

9.470,3 

4,66 

166,6 

2000 

4.921,7 

9.817,0 

5,85 

172,2 

2001 

5.433,5 

9.890,7 

3,45 

177,1 

2002 

5.779,2 

10.048,8 

1,62 

179,9 

2003 

6.071,2 

10.301,0 

1,02 

184,0 

2004 

6.421,6 

10.675,8 

1,38 

188,9 

2005 

6.691,7 

11.003,4 

3,16 

195,3 

2006 

7.035,5 

11.319,4 

4,73 

201,6 


Notas: M 2 = M 2 Oferta de moeda (bilhoes de dolares). 

PIB = produto intemo bruto (bilhoes de dolares). 

TBRATE = Letras do Tesouro de tres meses, (%). 

IPC = Indice de preipos ao consumidor (1982-1984 = 100). 


Presuma que R e P sejam exogenas e M e Y sejam endogenas. A Tabela 19.4 fornece dados sobre 
M (definipao de MY), Y (PIB), R (Letras do Tesouro de tres meses) e P (Indice de Precos ao 
Consumidor), nos Estados Unidos, entre 1970 e 2006. 

a. A funpao demanda e identificada? 

b. A fimgao oferta e identificada? 

c. Obtenha as expressoes para as equa£oes de forma reduzida para M e Y. 

d. Aplique o teste de simultaneidade para tuncao oferta. 

e. Como voce descobriria se Y na fun 5 ao oferta de moeda e de fato endogena? 




704 Parte Quatro Modelos de equagoes simultdneas e econometria de series temporals 


19.17. O teste de Hausman, discutido no texto, tambem pode ser conduzido da seguinte maneira. 

Considere a Equaqao (19.4.7): 

Qt — Po + Pi Pt + P\Vt + u 2i 

a. Uma vez que P, e v t possuem os mesmos coeficientes, como voce poderia testar se, em 
determinada aplicafao, este e realmente o caso? Quais as implica 5 oes disso? 

b. Uma vez que P, nao e correlacionada com u 2l pelo esquema (por que?), uma forma de 
descobrir se P r e exogena e verificar se v, e correlacionada com u 2t - Como voce faria para 
testar isso? Que teste utilizaria? ( Dica: substitua P, por meio de (19.4.6) pela Equac;ao 
(19.4.7)). 



Metodos de equagoes 
simultaneas 


Apos discutirmos a natureza dos modelos de equagoes simultaneas nos dois ultimos capitnlos, 
neste retomaremos o problema da estimagao dos parametros de tais modelos. A princlpio, podemos 
observar que o problema da estimagao e muito complexo, porque ha uma variedade de tecnicas com 
variadas propriedades estatfsticas. Em virtude da natureza deste texto, deveremos considerar apenas 
algumas dessas tecnicas de estimagao. Nossa discussao sera simples e, frequentemente, heurfstica, e 
os pontos mais refinados serao deixados para as referencias. 


20.1 Abordagens da estimagao 


Se considerarmos modelos de M equagoes em M variaveis endogenas dadas na Equagao (19.1.1), 
podemos adotar duas abordagens para estimar as equagoes estruturais: os metodos de equagao uni- 
ca, tambem conhecidos como metodos de informagao limitada e os metodos de sistema, tambem 
conhecidos como metodos de informagao completa. Nos metodos de equagao unica, em resumo, 
estimamos cada equagao no sistema (das equagoes simultaneas) individualmente, levando em conta 
quaisquer restrigoes incluidas naquela equagao (como a exclusao de algumas variaveis) sem ficarmos 
preocupados com as restrigoes nas outras equagoes do sistema, 1 daf o nome metodos de informagao 
limitada. Nos metodos de sistema, por outro lado, estimamos todas as equagoes no modelo simulta- 
neamente, levando em conta todas as restrigoes em tais equagoes pela omissao ou abstengao de algu¬ 
mas variaveis (lembre-se de que, para a identificagao, tais restrigoes sao essenciais), dai o nome 
metodos de informagao completa. 

Como exemplo, considere o seguinte modelo de quatro equagoes: 


Y\ t = @\o + + @uYit + PuY?,t+ + Y\\X\ t + + u\t 

Yit- ^ 20 + + + K 21 X\ t + Y22^2t + «2 1 

Ylt= @30+ @31 Y\t + + @34 Y$t+ Y3\X\t+ Y3lX2t+ + U3t 

Yai = @40+ + @4lY2t + Y43%3t+ «4r (20.1.1) 


em que os Y sao as variaveis endogenas e os X, as exogenas. Se estamos interessados em estimar, por 
exemplo, a terceira equagao, os metodos de equagao unica considerarao apenas essa equagao, obser- 
vando que as variaveis Y 2 e Y 3 sao excluldas dela. Nos sistemas de metodos, por outro lado, tentamos 
estimar todas as quatro equagoes simultaneamente, levando em conta todas as restrigoes impostas as 
varias equagoes do sistema. 


1 Para o proposito da identificagao, contudo, as informagoes fornecidas por outras equagoes terao de ser conside- 
radas. Mas, como observado no Capftulo 19, a estimagao e possfvel apenas no caso de equagoes (exatamente 
ou super) identificadas. Neste capftulo, consideraremos que o problema da identificagao e solucionado por meio 
das tecnicas do Capftulo 19. 
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Para preservarmos o espirito dos modelos de equagao simultanea, deveremos, idealmente, utili- 
zar o metodo dos sistemas, como o metodo de maxima verossimilhanga de informagao completa 
(full information maximum likelihood [FIML]). 2 Na pratica, esses metodos nao sao em geral utili- 
zados por um conjunto de razoes. Primeiro, a quantidade de calculos e enorme. Por exemplo, o 
modelo comparativamente pequeno (20 equagoes) de Klein-Goldberger para a economia americana, 
em 1955, possula 151 coeficientes nao nulos, dos quais os autores estimavam apenas 51 coeficientes 
utilizando os dados de series temporais. O modelo de econometria do Brookings-Social Science 
Research Council (SSRC) da economia americana, publicado em 1965, possula incialmente 150 
equagoes. 3 Embora tais modelos elaborados possam fornecer detalhes mais precisos dos varios se- 
tores da economia, os calculos sao uma tarefa exaustante mesmo nestes dias de computadores alta- 
mente velozes, e sem mencionar o custo envolvido. Em segundo lugar, os sistemas de metodos, 
como o FIML, levam a solugoes altamente nao lineares nos parametros e sao, portanto, frequente- 
mente dificeis de determinar. Terceiro, se ha um erro de especificagao (por exemplo, uma forma 
funcional errada ou exclusao de variaveis relevantes) em uma ou mais equagoes do sistema, esse 
erro e transmitido para o resto do sistema. Como resultado, os metodos do sistema tornam-se mais 
sensiveis para a especificagao de erros. 

Na pratica, os metodos de equagao unica sao muito usados. Como Klein observa: 

Os metodos de equagao unica, no contexto de um sistema simultaneo, podem ser menos sensiveis ao 

erro de especificagao no sentido de que essas partes do sistema que sao corretamente especificadas 

podem nao ser afetadas consideravelmente pelos erros de especificagao em outra parte. 4 

No resto do capitulo, trataremos apenas os metodos de equagao unica. Especificamente, discuti- 
remos os seguintes metodos de equagao unica: 

1. Mlnimos quadrados ordinarios (MQO); 

2. Mlnimos quadrados indiretos (MQI); 

3. Mlnimos quadrados em dois estagios (MQ2E). 

20.2 Modelos recursivos e mmirnos quadrados ordinarios 

Vimos no Capitulo 18 que, devido a interdependencia entre o termo de disturbio estocastico 
e a(s) variavel(is) explanatoria(s) endonega(s), o metodo MQO nao e apropriado para a estima- 
gao de uma equagao em um sistema de equagoes simultaneas. Se aplicados de maneira errada, 
entao, como vimos na Segao 18.3, os estimadores nao serao apenas viesados (em pequenas 
amostras), mas tambem inconsistentes; isto e, o vies nao desaparece, nao importando qual seja 
o tamanho da amostra. Ha, contudo, uma situagao em que os MQO podem ser aplicados apro- 
priadamente mesmo no contexto das equagoes simultaneas. Esse e o caso dos modelos recursi¬ 
vos, triangulares ou causais. 

Para ver a natureza desses modelos, considere o seguinte sistema de tres equagoes: 

Y\t= fiio + YnXu+ Vi2^2t+ u \t 

Yit = fiio+ Pi\Y\t + YixXu + Y 22 X 21 + uit (20.2.1) 

Y-}t= @30 + @3\ Y\t+ @3lY2t+ Y3\X\t+ Y32X2t+ U3t 


2 Para uma discussao simples sobre esse metodo, veja CHRIST, Carl F. Econometric models and methods. Nova York: 
John Wiley & Sons, 1966. p. 395-401. 

3 DUESENBERRY, James S.; FROMM, Gary; KLEIN, Lawrence R.; KUH, Edwin (Eds.). A quarterly model of the United 
States economy. Chicago: Rand McNally, 1965. 

4 KLEIN, Lawrence R. A textbook of econometrics. 2. ed. Englewood Cliffs, NJ: Prentice Hall, 1974. p. 150. 
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em que, como de costume, Y e X sao, respectivamente, as variaveis endogenas e exogenas. Os distur- 
bios sao tais que 


cov {u\u U 2t ) = CO w{u u . Hit) = cov(u 2l , U 3t ) = 0 


isto e, os disturbios de mesmo perfodo em equagoes diferentes nao sao correlacionados (tecnicamente, 
essa e a hipotese de correlagao contemporanea zero). 

Agora considere a primeira equagao de (20.2.1). Como contem apenas as variaveis exogenas no 
lado direito e, por hipotese, elas nao sao correlacionadas com o termo de disturbio u lt , essa equagao 
satisfaz a premissa critica dos classicos MQO, isto e, a nao correlacao entre as variaveis explanatorias 
e os disturbios estocasticos. Portanto, os MQO podem ser aplicados diretamente nessa equagao. Em 
seguida, considere a segunda equagao de (20.2.1), que contem a variavel endogena Y t como uma 
variavel explanatoria juntamente com os X nao estocasticos. Agora os MQO podem ser tambem apli¬ 
cados nessa equagao, desde que Y u e M 2 ,sejam nao correlacionados. Isso e verdade? A resposta e sim, 
porque U\, que afeta Y l , 6 hipoteticamente nao correlacionado com u 2 . Para propositos praticos, Y t e 
uma variavel predeterminada no que se refere a Y 2 . Pode-se proceder com a estima 5 ao dos MQO 
dessa equa§ao. Levando esse argumento adiante, podemos tambem aplicar os MQO a terceira equa- 
5 ao em (20.2.1), pois tanto Y x quanto Y 2 sao correlacionadas com m 3 . 

No sistema recursivo, os MQO podem ser aplicados a cada uma das equa 5 oes separadamente. Na 
verdade, nao temos um problema simultaneidade nessa situagao. Com base na estrutura de tal siste¬ 
ma, e claro que nao ha interdependencia entre as variaveis endogenas. Portanto, Y j afeta Y 2 , mas Y 2 
nao afeta Y\. Da mesma forma, Y l e Y 2 influenciam Y 3 sem, por seu turno, serem influenciadas por Y 3 . 
Em outras palavras, cada equagao exibe uma dependencia causal unilateral, dal o nome modelos 
causais. 5 Esquematicamente, temos aFigura 20.1. 


FIGURA 20.1 

Modelo recursivo. 



Como exemplo de um sistema recursivo, pode-se postular o seguinte modelo de determinagao de 
salario e prego: 


Equagao do prego: 
Equagao do salario: 


Pt - Pw + Pu W t ~ \ + finR, + PnM, + PuL, + u\ t 

W t = p 2 o + ftiUN, + p 32 P t + u 2t 


( 20 . 2 . 2 ) 


s O nome altemativo triangular origina-se do fato de que, se formamos a matriz dos coeficientes das variaveis 
endogenas dadas na Equagao (20.2.1), obtemos a seguinte matriz triangular: 




Yi 

Y~i 

Equagao 1 

1 

0 

0 ' 

Equagao 2 

ft! 1 

1 

0 

Equagao 3 



1 


Observe que as entradas acima da diagonal principal sao zeros (por que?). 
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em que P — taxa de varia9ao de prego por unidade de produgao 
W = taxa de variagao de salarios por funcionario 
R — taxa de variagao de pre90 do capital 
M — taxa de variagao de pre90s de importagao 
L — taxa de variagao de produtividade da mao de obra 
UN = taxa de desemprego, % * * * * * 6 

A equagao de pre90 postula que a taxa de mudan9a de pre90 no perfodo corrente e uma fungao das 
taxas de mudan9a nos pre90s do capital e da materia-prima, da taxa de mudan9a na produtividade do 
trabalho e da taxa de mudan9a nos salarios no perfodo anterior. A equagao de salario mostra que a taxa 
de mudan9a nos salarios no perfodo corrente e determinada pela taxa de perfodo corrente da mudan9a 
na taxa de pre90 e de desemprego. E claro que a cadeia causal opera com base em W t - { P t —> W t , 
e, portanto, os MQO podem ser aplicados para estimar os parametros de duas equagoes individual- 
mente. 

Embora os modelos recursivos tenham provado ser uteis, a maioria dos modelos de equagao si- 
multanea nao exibe tal relagao unilateral de causa e efeito. Os MQO, em geral, nao sao apropriados 
para estimar a equagao linica no contexto de um modelo de equagoes simultaneas . 7 

Ha pessoas que argumentam que, embora os MQO em geral nao possam ser aplicados aos mode¬ 
los de equagoes simultaneas, pode-se utiliza-los apenas como um padrao ou norma de comparagao. 
Isto e, pode-se estimar uma equagao estrutural por MQO, com as propriedades resultantes de vies, 
inconsistencia etc. A mesma equagao pode ser estimada por outros metodos especialmente projetados 
para lidar com o problema da simultaneidade e os resultados dos dois metodos, comparados, ao me- 
nos, qualitativamente. Em muitas aplicagoes, os resultados dos MQO aplicados inapropriadamente 
podem nao diferir muito dos obtidos por meio de metodos mais sofisticados, como veremos mais 
adiante. Em princfpio, pode-se nao ter muita objegao a produgao de resultados baseados nos MQO, 
contanto que as estimativas baseadas em metodos alternatives desenvolvidos para modelos de equa¬ 
goes simultaneas sejam tambem oferecidas. De fato, essa abordagem poderia nos dar alguma ideia a 
respeito da ineficacia dos MQO em situa9oes em que eles nao sao apropriadamente aplicados . 8 


20.3 Estima^ao de uma equa^ao exatamente identificada: o metodo 
de mmimos quadrados indiretos (MQI) 


Para uma equa9ao estrutural apenas identificada ou exatamente identificada o metodo para se 

obter as estimativas dos coeficientes estruturais com base nas estimativas de MQO dos coeficientes 

de forma reduzida e conhecido como metodo de mmimos quadrados indiretos (MQI), e as estima¬ 
tivas entao obtidas sao conhecidas como estimativas de mmimos quadrados indiretos. Os MQI 

envolvem os tres passos seguintes: 

Passo 1 . Primeiro, obtemos as equa9oes na forma reduzida. Como observado no Capftulo 
19 , essas equa9oes sao obtidas por meio de equa9oes estruturais de forma que a variavel 

6 0 sfmbolo ponto significa "derivada no tempo". Por exemplo, P = dP/dt. Para a serie de tempo discreta, dP/dt 
e por vezes aproximada de AP/At, em que o sfmbolo A e o primeiro operador de diferenga, primeiramente in- 
troduzido no Capftulo 12. 

7 E importante ter em vista que estamos presumindo que os disturbios nas equagoes sao contemporaneamente 
nao correlacionados. Se este nao for o caso, poderemos ter de recorrer a tecnica de estimagao de regressoes 
aparentemente nao correlacionadas, SURE ( seemingly unrelated regressions ) de Zellner para estimar os parame¬ 
tros do sistema recursivo. Veja ZELLNER "An efficient method of estimating seemingly unrelated regressions 
and tests for aggregation bias." Journal of the American Statistical Association, v. 57, p. 348-368, 1962. 

8 Tambem pode ser observado que, em pequenas amostras, os estimadores alternativos, como os estimadores de 
MQO, sao igualmente viesados. Mas o estimador de MQO possui a "virtude" de ter uma variancia minima entre 
os estimadores alternativos. Mas isso e verdade apenas em pequenas amostras. 
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dependente em cada equagao seja a unica variavel endogena e uma fungao apenas das variaveis 
predeterminadas (exogenas ou endogenas defasadas) e do(s) termo(s) de erro estocastico. 
Passo 2. Aplicamos individualmente os MQO nas equagoes de forma reduzida. Essa ope- 
ragao e possfvel na medida em que as variaveis explanatorias nessas equagoes forem prede¬ 
terminadas e, portanto, nao correlacionadas com os disturbios estocasticos. As estimativas 
obtidas sao consistentes. 9 

Passo 3. Obtemos as estimativas dos coeficientes estruturais originais com base nos coefi- 
cientes da forma reduzida estimados obtidos no Passo 2. Como observado no Capftulo 19, se 
uma equagao e exatamente identificada, ha uma correspondencia de um para um entre os 
coeficientes de forma reduzida e os estruturais; isto e, pode-se derivar estimativas tinicas do 
primeiro por meio do ultimo. 

Como o procedimento dos tres passos indica, o nome MQI vem do fato de que os coeficientes 
estruturais (o objeto da investigagao primaria na maioria dos casos) sao obtidos indiretamente com 
base nas estimativas de MQO dos coeficientes de forma reduzida. 

Um exemplo 

Considere o modelo de oferta e demanda introduzido na Segao 19.2, que, por conveniencia, e 
apresentado a seguir com uma leve mudanga na notagao: 

Fungao de demanda: Qt = «o + ot\P t + 0 LjX t + u\ t (20.3.1) 

Fungao de oferta: Qt = Po + Pi Ft + u 21 (20.3.2) 

em que Q = quantidade 
P — prego 
X = renda ou gastos 

Suponha que X seja exogena. Como observado, a fungao de oferta e exatamente identificada en- 
quanto a fungao de demanda nao o e. 

As equagoes de forma reduzida que correspondent as equagoes estruturais anteriores sao 

Pt = n 0 + H x X t + w, (20.3.3) 

Qt= n 2 + n 3 x, + v, (20.3.4) 

em que os Id sao coeficientes de forma reduzida e combinagoes (nao lineares) dos coeficientes estru¬ 
turais, como mostrado nas Equagoes (19.2.16) e (19.2.18), e w e v sao combinagoes lineares dos dis¬ 
turbios estruturais u\ e u 2 . 

Observe que cada equagao de forma reduzida content apenas uma variavel endogena, que e a va¬ 
riavel dependente e que e uma fungao apenas da variavel exogena X (renda) e dos disturbios estocas¬ 
ticos. Portanto, os parametros das equagoes de forma reduzida anteriores podem ser estimados pelos 
MQO. Essas estimativas sao 


n, = 

JlPtX, 

(20.3.5) 

£*? 

n 0 = 

P- fl\X 

(20.3.6) 

n 3 = 

£ x J 

(20.3.7) 

n 2 = 

Q- n 3 x 

(20.3.8) 


9 Alem de serem consistentes, as estimativas "podem ser melhores nao viesadas e/ou assintomaticamente eficientes, 
dependendo, respectivamente, se (/) os z [= X] sao exogenos e nao meramente predeterminados (isto e, nao 
content valores defasados de variaveis endogenas) e/ou ( ii) a distribuigao dos disturbios e normal". Veja HOOD, W. 
C.; KOOPMANS, Tjaliing C. Studies in econometric method. Nova York: John Wiley & Sons, 1 953. p. 133. 
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em que as letras minusculas, como de costume, denotam desvios em redact as medias da amostra e 
Q e P sao os valores medios da amostra dc Q e I 3 . Como observado, os FI, sao estimadores consis- 
tentes e sob hipoteses apropriadas sao tambem nao viesados de variancia minima ou assintomatica- 
mente eficiente (veja a nota de rodape 9). 

Posto que nosso objetivo principal e determinar os coeficientes estruturais, veremos se podemos 
estima-los por meio dos coeficientes de forma reduzida. Como se viu na Se 9 ao 19.2, a fiuujao oferta 
e exatamente identificada. Sendo assim, seus parametros podem ser estimados exclusivamente por 
meio dos coeficientes de forma reduzida como a seguir: 

Po = n 2 - Pin 0 e p x = Hi 

iti 

As estimativas desses parametros podem ser obtidas com base nas estimativas dos coeficientes de 
forma reduzida como 


Po =n 2 -/s,flo (20.3.9) 

Pi = 5 1 (20.3.10) 

ni 

que sao os estimadores de MQI. Observe que os parametros da fungao demanda nao podem ser esti¬ 
mados (contudo, veja o Exerclcio 20.13). 

Para oferecermos alguns resultados numericos, obtivemos os dados observados na Tabela 20.1. 
Primeiro, estimamos as equa 9 oes de forma reduzida, regredindo separadamente pre 90 e quantidade 
sobre a despesa real de consumo per capita. Os resultados sao os seguintes: 

P, = 90,9601 + 0,0007X ( 

ep = (4,0517) (0,0002) 

t= (22,4499) (3,0060) 

Q, = 59,7618 + 0,0020A, 

ep = (1,5600) (0,00009) 

t= (38,3080) (20,9273) 


R 2 = (0,2440) 


R 2 = 0,9399 


(20.3.11) 


(20.3.12) 


Utilizando as Equa 5 oes (20.3.9) e (20.3.10), obtemos estas estimativas de MQI: 

Po = ~ 183,7043 
Pi = 2,6766 


(20.3.13) 

(20.3.14) 


Portanto, a regressao de MQI estimada e 10 

Qt=~ 183,7043 + 2,6766 P, 


(20.3.15) 


Para compara 9 ao, oferecemos os resultados da regressao MQO de Q sobre P (aplicada inapropria- 
damente): 


Q t = 20,89 + 0,673/V 
ep = (23,04) (0,2246) 
t= (0,91) (2,99) R 2 = 0,2430 


(20.3.16) 


10 Nao apresentamos os erros padrao dos coeficientes estruturais estimados, porque, como observado anterior- 
mente, esses coeficientes sao em geral fungoes nao lineares dos coeficientes de forma reduzida e nao ha ne- 
nhum metodo simples de estimar seus erros padrao com base nos erros padrao de coeficientes de forma 
reduzida. Para amostras de tamanho grande, contudo, os erros padrao dos coeficientes estruturais podem ser 
obtidos de maneira aproximada. Para mais detalhes, veja KMENTA, Jan. Elements of econometrics. Nova York: 
Macmillan, 1971. p.444. 
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TABELA 20.1 

Produ§ao de safra, 
pre£os de safra e 
gastos de consumo 
pessoal per capita, 
em dolares de 2007, 
Estados Unidos, 
1975-2004 

Fonte: Economic Report of 
the President, 2007. Dados 
sobre Q (Tabela B-99), so- 
bre P (Tabela B-101) e sobre 
X (Tabela B-31). 


Ano 

Indice de produfao 
de safra 
(1996= 100), Q 

Indice de pre^os de safra 
recebidos pelos produtores 
(1990-1992= 100), P 

Gastos reais de 
consumo pessoal 
per capita, X 

1975 

66 

88 

4.789 

1976 

67 

87 

5.282 

1977 

71 

83 

5.804 

1978 

73 

89 

6.417 

1979 

78 

98 

7.073 

1980 

75 

107 

7.716 

1981 

81 

111 

8.439 

1982 

82 

98 

8.945 

1983 

71 

108 

9.775 

1984 

81 

111 

10.589 

1985 

85 

98 

11.406 

1986 

82 

87 

12.048 

1987 

84 

86 

12.766 

1988 

80 

104 

13.685 

1989 

86 

109 

14.546 

1990 

90 

103 

15.349 

1991 

90 

101 

15.722 

1992 

96 

101 

16.485 

1993 

91 

102 

1 7.204 

1994 

101 

105 

18.004 

1995 

96 

112 

18.665 

1996 

100 

127 

19.490 

1997 

104 

115 

20.323 

1998 

105 

107 

21.291 

1999 

108 

97 

22.491 

2000 

108 

96 

23.862 

2001 

108 

99 

24.722 

2002 

107 

105 

25.501 

2003 

108 

111 

26.463 

2004 

112 

117 

27.937 


Esses resultados mostram como os MQO podem distorcer o quadro “real” quando aplicados 
em situa£oes inapropriadas. 

Propriedades dos estimadores de MQI 

Vimos que os estimadores dos coeficientes de forma reduzida sao consistentes e, sob hipoteses 
adequadas, tambem sao os melhores estimadores nao viesados ou assintomaticamente eficientes 
(veja a nota de rodape 9). Essas propriedades sao transferidas para os estimadores de MQI? Pode-se 
demonstrar que os estimadores de MQI herdam todas as propriedades assintoticas dos estimado¬ 
res de forma reduzida, como a consistencia e a eficiencia assintotica. Mas propriedades (em amos- 
tras menores) como a nao tendenciosidade em geral nao permanecem verdadeiras. Mostraremos 
no Apendice 20A, Se£ao 20A.1, que os estimadores de MQI /) 0 e fi] da funcao oferta apresentados 
anteriormente sao viesados, mas o vies desaparece a medida que o tamanho da amostra aumenta 
indefinidamente (isto e, os estimadores sao consistentes). 11 


11 Intuitivamene, isso pode ser visto como se segue: E0-\)= p-\ se £(n 3 )fli) = (£[ 3 / 111 ). Agora, mesmo que 
£(EI 3 ) = n 3 e £(fli)= Eli, pode ser demonstrado que £(n 3 /rii) ^ £(n 3 )/£(rii); isto e, a expectativa da 
razao de duas variaveis nao e igual a razao das expectativas de duas variaveis. Entretanto, como demonstrado 
no Apendice 20A.1, plim (fE/rii ) = plim (EEVpIim (Eli) = n 3 /rii, pode ser demonstrado uma vez que n 3 e 
rii sao estimadores consistentes. 
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20.4 Estima^ao de uma equapao superindentificada: o metodo dos 
mmimos quadrados em dois estagios (MQ2E) 

Considere o seguinte modelo: 

Fungao renda: Y u = P 10 + + PuYit + Y\\X\t + Yi 2 ^ 2 t + u u (20.4.1) 

Fungao oferta Y 2 t = P 20 + Pi\Y\t + u 2t 

de moeda: (20.4.2) 


em que K, = renda 

Y 2 = estoque de moeda 

— gastos com investimento 
X 2 — gastos do governo em bens e servipos 

As variaveis X } e X 2 sao exogenas. 

A equapao de renda, um hibrido das abordagens da teoria da quantidade de Keynes para a deter- 
minapao da renda, estabelece que a renda e determinada pela oferta de moeda, pelos gastos em inves¬ 
timento e pelos gastos governamentais. A fungao oferta de moeda postula que o estoque de moeda e 
determinado (pelo Banco Central Americano) com base no nfvel de renda. Obviamente, temos um 
problema de equapao simultanea, que pode ser averiguado pelo teste de simultaneidade discutido no 
Capftulo 19. 

Aplicando a condipao de ordem de identificapao, podemos ver que a equapao de renda e subidenti- 
ficada, enquanto a equapao de oferta de moeda e superidentificada. Nao ha muito que possa ser 
feito a respeito da equapao de renda a nao ser modificar a especificapao do modelo. A funpao 
oferta de moeda superidentificada pode nao ser estimada pelos MQI, porque ha duas estimativas 
de p 2 1 (o leitor deve verificar isso por meio dos coeficientes de forma reduzida). 

Por uma auestao nratica, node-se anlicar os MOO a eauacao de oferta de moeda. mas as estimati¬ 

vas entao obtidas serao inconsistentes em vista da correlacao nrovavel entre a variavel exnlanatoria 
estocastica Y, c o termo de disturbio estocastico u 2i Sunonha, contudo. que descubramos uma “proxy' 
para a variavel exnlanatoria estocastica Y , de modo que, embora “semelhante" a Y , ( no sentido de que 
e altamente correlacionada com Pi), ela nao e correlacionada com u->. Essa oroxx e tambem conheci- 
da como uma variavel instrumental (veia o Capftulo 17). Se foi possfvel encontrar tal proxy, os 
MOO podem ser utilizados diretamente para estimar a funcao de oferta de moeda . 

Mas como pode obter essa variavel instrumental? Uma resposta e fornecida pelos mmimos qua¬ 
drados em dois estagios (MQ2E), metodo desenvolvido independentemente por Henri Theil 12 e Robert 
Basmann 1 '. Como o nome indica, o metodo envolve duas aplicapoes sucessivas de MQO. O proces- 
soeo seguinte: 

Estagio 1. Para livrar-se da correlapao provavel entre Yj e u 2 , regrida primeiro Y\ sobre 
todas as variaveis predeterminadas em todo o sistema, nao apenas sobre essa equapao. Nes¬ 
te caso, isso significa regredir Y\ sobre X t e X 2 como se segue: 

Y\ t — flo + fliX], + t\ 2 X 2t + u, (20.4.3) 

em que u, sao os habituais resfduos de MQO. Da Equapao (20.4.3), obtemos 

Y\t = flo + + fl2^f2( (20.4.4) 


12 ’THEIL, Henri. ( Repeated least-squares applied to complete equation systems.) The Hague: The Central Planning 
Bureau, The Netherlands, 1953. Mimeografado. 

13 BASMANN, Robert L. "A generalized classical method of linear estimation of coefficients in a structural 
equation." Econometrica, 1957. v. 25, p. 77-83. 
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em que Y lr e uma estimativa do valor medio de Y condicionado aos X fixados. Observe que 
a Equagao (20.4.3) nao e nada alem de uma regressao de forma reduzida, porque apenas as 
varaveis exogenas e predeterminadas aparecem no lado direito. 

A Equagao (20.4.3) pode agora ser expressa como 

Y u = Yu + u t (20.4.5) 

que mostra que o Y 1 estocastico consiste em duas partes: Y u que e uma combinagao linear de 
X nao estocasticos, e o componente aleatorio u,. De acordo com a teoria dos MQO, Y u e u, 
sao nao correlacionados. (Por que?) 

Estagio 2. A equagao de oferta de moeda superidentificada pode agora ser escrita como 
Ylt = @20 + @2l(Y\ t + U t ) + U2t 

= @20 + @2lYu + {U2t + @2lU t ) (20.4.6) 

= @20 + Pn Yu + u* 

em que m* = u 2t + @21 u t . 

Comparando a Equagao (20.4.6) com a Equagao (20.4.2), vemos que sao semelhantes na 
aparencia; a linica diferenga e que K| e substitufda por Y h Qual a vantagem da Equagao 
(20.4.6)? Pode-se demonstrar que embora Y x na equagao original de oferta de moeda e cor- 
relacionada ou provavelmente correlacionada com o termo de disturbio m 2 (portanto, faz 
com que os MQO sejam inapropriados), Y u na Equagao (20.4.6) e nao correlacionada com 
u* assintoticamente, isto e, na amostra maior (ou de forma mais precisa, na medida em que 
o tamanho da amostra cresce indefinidamente). Como resultado, os MQO podem ser aplica- 
dos a Equagao (20.4.6), que fornecera estimativas dos parametros da fiingao da oferta de 
moeda. 14 

A conclusao de tudo isso e que, em amostras pequenas, o procedimento de MQ2E pode levar a 
estimagao viesada. 

Como o procedimento de dois estagios indica, a ideia basica que fundamenta o MQ2E e “purifi- 
car” a variavel explanatoria estocastica Y j da influencia do disturbio estocastico u 2 . Esse objetivo e 
alcangado ao executar a regressao de forma reduzida de K, em todas as variaveis predeterminadas no 
sistema (Estagio 1), obtendo as estimativas Y lt e substituindo Y u na equagao original pela estimada 
Yu, e entao aplicando os MQO a equagao entao transformada (Estagio 2). Os estimadores obtidos sao 
consistentes; isto e, eles convergem aos seus valores reais a medida que o tamanho da amostra au- 
menta indefinidamente. 

Para ilustrarmos mais ainda os MQ2E, vamos modificar o modelo de oferta de renda-moeda como 
se segue: 

Yu- fiio + P\iY 2 t+ Y\\X\t+ YuXu + uu (20.4.7) 

Y 2 t= P20+ PllYlt + y23^3( + Y 24 % 4 t+ u 2t (20.4.8) 

em que, alem das variaveis ja definidas, X 2 — renda no perfodo de tempo anterior e X 4 = oferta de 

moeda no perfodo anterior. Tanto X 3 quanto X 4 sao predeterminadas. 

14 Mas observe que, em amostras pequenas, e provavel que V), seja correlacionado com u‘. A razao e a seguinte: 
com base na Equagao (20.4.4), vemos que 9i t e uma combinagao linear ponderada dos X predeterminados, 
sendo IT os pesos. Agora, mesmo que as variaveis predeterminadas sejam verdadeiramente nao estocasticas, os 
n, sendo estimadores, sao estocasticos. Entao, V), tambem e estocastico. Agora, com base em nossa discussao 
das equagoes de forma reduzida e da estimagao dos mihimos quadrados indiretos, esta claro que os coeficien- 
tes reduzidos, os n, sao correlacionados com u 2 , que e um componente de u* Como resultado, espera-se que 
f,, seja correlacionado com u*. Mas, como observado, essa correlagao desaparece a medida que o tamanho da 
amostra tende ao infinito. 
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Rapidamente, pode-se verificar que tanto as Equaqoes (20.4.7) quanto (20.4.7) sao superidentifi- 
cadas. Para aplicar os MQ2E, procedemos como se segue: no Estagio 1, regredimos as variaveis en- 
dogenas em todas as variaveis predeterminadas no sistema. Entao 

Y\t = fllO + flnXi, + fl 12 X 2 , + ^ 13 X 3 , + fli4^4/ + U\ t (20.4.9) 

Y 2 t = fl 20 + fl 21 ^ 1 r + Yl 22 ^ 2 t + n 23 X 3r + 1124 X 4 , + U 2 t (20.4.10) 

No Estagio 2, substitufmos Y\ e Y 2 nas equa£oes (estruturais) originais pelos seus valores estima- 
dos corn base nas duas regressoes anteriores e operamos as regressoes de MQO como se segue: 

Y\ t = + PiiYit + ynXi, + 712 X 2 , + u\ t (20.4.11) 

Yit = P 20 + h\Y\t + 723 X 3 , + 724 X 4 , + u 2t ( 20 . 4 . 12 ) 

emque u\ t = u\ t + P\ 2 U 2 t e u* 2t = M 2 , + P 2 \u\ t . As estimativas obtidas serao consistentes. Obser¬ 
ve as seguintes caracteristicas dos MQ2E: 

1. Pode-se aplica-los a uma equa£ao individual no sistema sem diretamente levar em conta qual(is) 
quer outra(s) cquaqaotdes) no sistema. Para solucionar modelos econometricos que envolvem 
grande numero de equa§oes, os MQ2E oferecem um metodo economico. Por isso, o metodo tem 
sido altamente utilizado na pratica. 

2. Diferentemente dos MQ1, que fornecem estimativas nuiltiplas dos parametros nas equa 5 oes su- 
peridentificadas, os MQ2E fornecem apenas uma estimativa por parametro. 

3. E de facil aplicaqao porque tudo o que se precisa saber e o numero total das variaveis exogenas 
ou predeterminadas do sistema sem conhecer outras variaveis do sistema. 

4. Embora especialmente planejado para lidar com as equafoes superidentificadas, o metodo 
pode tambem ser aplicado as equates exatamente identificadas. Desse modo, os MQI e MQ2E 
fornecerao estimativas identicas. (Por que?) 

5. Se os valores de R 2 nas regressoes de forma reduzida (isto e, as regressoes de Estagio 1) sao muito 
altos, por exemplo, maiores que 0,8, as estimativas classic as de MQO e as estimativas de MQ2E 
estarao muito proximas. Mas esse resultado nao deveria ser surpreendente, porque, se o valor de 
R 2 no primeiro estagio for muito alto, significa que os valores estimados das variaveis endogenas 
estarao muito proximos dos seus valores reais, e, portanto, ha menos probabilidade de esses va¬ 
lores estarem correlacionados com os disturbios estocasticos nas equa 5 oes estruturais originais. 
(Por que?) 15 Se, contudo, os valores de R 2 nas regressoes de primeiro estagio sao muito mais 
baixas, as estimativas de MQ2E serao praticamente sem sentido, porque deveremos substituir os 
Y originais nas regressoes de segundo estagio pelos Y estimados por meio das regressoes de 
primeiro estagio, que representarao essencialmente os disturbios nas regressoes de primeiro esta¬ 
gio. Em outras palavras, neste caso, os Y serao proxies muito precarias para os Y originais. 

6. Perceba que, ao relatarmos a regressao MQI na Equagao (20.3.15), nao declaramos os erros 
padrao dos coeficientes estimados (pelas razoes explicadas na nota de rodape 10). Mas podemos 
fazer isso para as estimativas de MQ2E, porque os coeficientes estruturais sao diretamente esti¬ 
mados com base nas regressoes de segundo estagio (MQO). Ha, contudo, uma precauijao que 
deve ser tomada: os erros padrao estimados nas regressoes de segundo estagio precisam ser mo- 
dificados, porque, como se pode ver pela Equacjao (20.4.6), o termo de erro u* e, de fato, o termo 
de erro u 2l mais /3 2 \u,. Portanto, a variancia de u* nao e exatamente igual a variancia do original 
u 2l . Entretanto, a modifica 5 ao requerida pode ser facilmente efetuada pela formula apresentada no 
Apendice 20A, Se 5 ao 20A.2. 


15 No caso extremo de R 2 = 1 na regressao de primeiro estagio, a variavel explanatory endogena na equagao 
original (superidentificada) sera praticamente nao estocastica (por que?). 
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7. Ao utilizar os MQ2E, tenha em mente as seguintes observagoes de Henri Theil: 

A justificativa estatistica do MQ2E considera que se trabalha com grandes amostras. Quando nao 
ha variaveis endogenas defasadas, [...] os estimadores de coeficiente de MQ2E sao consistentes se 
as variaveis exogenas sao constantes em amostras repetidas e se o(s) disturbio(s) [que aparecem 
nas varias equagoes comportamentais e estruturais] [...] sao independentemente ou identicamente 
distribuidos com medias zero e variancias finitas [...]• Se essas duas condigSes forem satisfeitas, a 
distribuigao das amostras dos estimadores de coeficientes de MQ2E tornam-se aproximadamente 
normais para amostras grandesf...]. 

Quando o sistema de equagoes content variaveis endogenas defasadas, a consistencia e a normalida- 
de da amostra grande dos estimadores de coeficientes de MQ2E requerem unta condigao adicional, 
[...] que, a ntedida que a amostra cresce, o quadrado medio dos valores assumidos por unta variavel 
endogena defasada converge, em probabilidade, para um limite positivo [...]. 

Se [os disturbios que aparecem nas diversas equagoes estruturais sao] nao sao independentemente dis- 
tribufdos, variaveis endogenas defasadas nao sao independentes da operagao corrente do sistema da 
equagaof..], o que significa que essas variaveis nao sao realmente predeterminadas. Se essas variaveis 
sao, no entanto, tratadas como predeterminadas no procedimento MQ2E, os estimadores resultantes 
nao sao consistentes. 16 


20.5 MQ2E: um exemplo mimerico 


Para ilustrar o modelo MQ2E, considere o modelo de oferta de moeda-renda dado previamente 
nas Equagoes (20.4.1). Como demonstrado, a equagao de oferta de moeda e superidentificada. Para 
estimarmos os parametros dessa equagao, utilizamos o metodo de minimos quadrados de dois esta- 
gios. Os dados requeridos para a analise sao dados na Tabela 20.2; ela tambem oferece alguns dados 
necessarios para responder algumas das questoes dos exerefeios. 

Regressao do Estagio 1 

Primeiro, regredimos a variavel explanatoria estocastica de renda K,, representada pelo PIB, sobre 
as variaveis predeterminadas de investimento privado, X h e de gastos governamentais, X 2 , obtendo 
os seguintes resultados: 


Y lt = 2689,848 + 

1,8700X U + 

2,0343A 2 , 


ep = (67,9874) 

(0,1717) 

(0,1075) 

(20.5.1) 

t= (39,5639) 

(10,8938) 

(18,9295) R 2 = 0,9964 



Regressao do Estagio 2 

Estimamos agora a fungao de oferta de moeda (20.4.2), substituindo a variavel endogena pela 
Ki estimada por meio da Equagao (20.5.1) ( = ¥{). Os resultados sao os seguintes: 

f 2l = - 2440,180 + 0,7920 Y u 

ep = (127,3720) (0,0178) (20.5.2) 

t= (-19,1579) (44,5246) i? 2 = 0,9831 

Como ressaltado, os erros padrao estimados na Equagao (20.5.2) precisam ser corrigidos da forma 
como e sugerida no Apendice 20.A, Segao 20A.2. Efetuando essa corregao (a maioria dos pacotes 
econometricos pode faze-la hoje em dia), obtemos os seguintes resultados: 

Y 2t =- 2440,180 + 0,7920^, 

ep = (126,9598) (0,0212) (20.5.3) 

t= (- 17,3149) (37,3057) R 2 = 0,9803 

16 THEIL, Henri. Introduction to econometrics. Englewood Cliffs, NJ: Prentice Hall, 1978. p. 341-342. 
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TABELA 20.2 

PIB, M2, FEDEXP, 
TB6, EUA, 1970- 
2005 

Fonte: Economic Report of 
the President, 2007. Tabelas 
B-2, B-69, B-84 e B-73. 


Ano 

PIB (Vi) 

1970 

3.771,9 

1971 

3.898,6 

1972 

4.105,0 

1973 

4.341,5 

1974 

4.319,6 

1975 

4.311,2 

1976 

4.540,9 

1977 

4.750,5 

1978 

5.015,0 

1979 

5.173,4 

1980 

5.161,7 

1981 

5.291,7 

1982 

5.189,3 

1983 

5.423,8 

1984 

5.813,6 

1985 

6.053,7 

1986 

6.263,6 

1987 

6.475,1 

1988 

6.742,7 

1989 

6.981,4 

1990 

7.112,5 

1991 

7.100,5 

1992 

7.336,6 

1993 

7.532,7 

1994 

7.835,5 

1995 

8.031,7 

1996 

8.328,9 

1997 

8.703,5 

1998 

9.066,9 

1999 

9.470,3 

2000 

9.817,0 

2001 

9.890,7 

2002 

10.048,8 

2003 

10.301,0 

2004 

10.703,5 

2005 

11.048,6 


M2 (V 2 ) 

GPDI (Xi) 

626,5 

427,1 

710,3 

475,7 

802,3 

532,1 

855,5 

594,4 

902,1 

550,6 

1.016,2 

453,1 

1.152,0 

544,7 

1.270,3 

627,0 

1.366,0 

702,6 

1.473,7 

725,0 

1.599,8 

645,3 

1.755,4 

704,9 

1.910,3 

606,0 

2.126,5 

662,f) 

2.310,0 

857,7 

2.495,7 

849,7 

2.732,4 

843,9 

2.831,4 

870,0 

2.994,5 

890,5 

3.158,5 

926,2 

3.278,6 

895,1 

3.379,1 

822,2 

3.432,5 

889,0 

3.484,0 

968,3 

3.497,5 

1.099,6 

3.640,4 

1.134,0 

3.815,1 

1.234,3 

4.031,6 

1.387,7 

4.379,0 

1.524,1 

4.641,1 

1.642,6 

4.920,9 

1.735,5 

5.430,3 

1.598,4 

5.774,1 

1.557,1 

6.062,0 

1.613,1 

6.411,7 

1.770,6 

6.669,4 

1.866,3 


DEXP (X 2 ) 

TB6 (X 3 ) 

201,1 

6,562 

220,0 

4,511 

244,4 

4,466 

261,7 

7,178 

293,3 

7,926 

346,2 

6,122 

374,3 

5,266 

407,5 

5,510 

450,0 

7,572 

497,5 

10,017 

585,7 

11,374 

672,7 

13,776 

748,5 

11,084 

815,4 

8,75 

877,1 

9,80 

948,2 

7,66 

1.006,0 

6,03 

1.041,6 

6,05 

1.092,7 

6,92 

1.167,5 

8,04 

1.253,5 

7,47 

1.315,0 

5,49 

1.444,6 

3,57 

1.496,0 

3,14 

1.533,1 

4,66 

1.603,5 

5,59 

1.665,8 

5,09 

1.708,9 

5,18 

1.734,9 

4,85 

1.787,6 

4,76 

1.864,4 

5,92 

1.969,5 

3,39 

2.101,1 

1,69 

2.252,1 

1,06 

2.383,0 

1,58 

2.555,9 

3,40 


Notas: Y\ = PIB = Produto Interno Bruto ($, bilhoes, ajustado de $ 2.000). 

Y 2 = M2 = Oferta de moeda M2 (bilhoes de dolares). 

X\ = GPDI = Investimento privado nacional bruto ($, bilhoes, ajustado de $ 2.000). 
X 2 = FEDEXP = Despesas do governo federal (bilhoes de dolares). 

X$ = TB6 = Taxa semestral de letras do Tesouro (%). 


Como observado no Apendice 20A, Segao 20A.2, os erros padrao dados na Equagao (20.5.3) nao 
diferem muito daqueles da Equagao (20.5.2), porque o R 1 na regressao do Estagio 1 e muito alto. 

Regressao por MQO 

Para comparagao, fornecemos a regressao do estoque de moeda sobre a renda como demons- 
trado na Equagao (20.4.2) sem “expurgar” a Y lt estocastica da influencia do termo de disturbio 
estocastico. 


Y lt =- 2195,468 + 0,791 \Y U 

ep = (126,6460) (0,0211) 

t= (- 17,3354) (37,3812) 


R 2 = 0,9803 


(20.5.4) 
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Comparando os resultados obtidos pelo uso inapropriado dos MQO com a regressao do Estagio 
2, verificamos que ambas sao praticamnete identicas. Isso significa que o procedimento de MQ2E e 
inutil? De forma alguma. Na situagao atual, nao deve ser surpreendente que os dois resultados sejam 
praticamente identicos, pois, como visto, o valor R 2 no primeiro estagio e muito alto, o que torna o 
Y lt praticamente identico ao real Y\ t . Nesse caso os MQO e as regressoes de segundo estagio serao 
mais ou menos semelhantes. Mas nao ha garantia de que isso acontecera em todas as aplicagoes. Uma 
implicagao e que em equagoes superidentificadas pode-se nao aceitar o classico procedimento de 
MQO sem verificar a(s) regressao(oes) de segundo estagio. 

Simultaneidade entre PIB e oferta de moeda 

Vamos descobrir se o PIB (I^) e a oferta de moeda (Y 2 ) sao mutuamente dependentes. Com esse 
proposito, utilizamos o teste de Hausman de simultaneidade discutido no Capftulo 19. 

Primeiro, fazemos a regressao do PIB sobre Xj (gastos com investimento) e X 2 (gastos do governo), 
as variaveis exogenas no sistema (isto e, estimamos a regressao de forma reduzida). Por meio dessa 
regressao, obtemos o PIB estimado e os resfduos iQ, como sugerido na Equagao (19.4.7). Entao, faze¬ 
mos a regressao da oferta de moeda sobre o PIB estimado e v t para obter os seguintes resultados: 

Y 2 t = — 2198,297 + 0,79157 lr + 0,6984vy 

ep = (129,0548) (0,0215) (0,2970) (20.5.5) 

t = (- 17,0338) (36,70016) (2,3511) 

Uma vez que o valor t de v, e estatisticamente significativo (o valor p e 0,0263), nao podemos 
rejeitar a hipotese da simultaneidade entre a oferta de moeda e o PIB, o que nao deveria ser surpresa. 
( Nota: essa conclusao e valida apenas para amostras grandes; tecnicamente, e valida apenas a medida 
que o tamanho da amostra cresce indefinidamente.) 

Testando a hipotese 

Suponha que queiramos testar a hipotese de que a renda nao tem efeito sobre a demanda de moeda. 
Podemos testar essa hipotese com o teste t habitual por meio da regressao estimada (20.5.2)? Sim, desde 
que a amostra seja grande e que os erros padrao sejam corrigidos, como demonstrado na Equagao (20.5.3), 
podemos utilizar o teste t para testar o valor de um coeficiente individual e o teste h para testar juntamen- 
te o valor de dois ou mais coeficientes, utilizando a formula (8.4.7). 17 

O que acontece se o termo de erro em uma equagao estrutural estiver autocorrelacionado e/ou 
correlacionado com o termo de erro em outra equagao estrutural no sistema? Uma resposta completa 
para essa questao vai alem do objetivo deste livro e e melhor deixar isso para as referencias (veja a 
referenda da nota de rodape 7). No entanto, as tecnicas de estimagao (como a tecnica SURE de Zellner) 
existem para lidar com essas complicagoes. 

Para concluir a discussao de nosso exemplo numerico, pode-se acrescentar que os varios passos 
envolvidos na aplicagao dos MQ2E agora sao rotineiramente tratados por pacotes de software como 
o STATA e o EViews. Mostramos os detalhes dos MQ2E apenas por razoes pedagogicas. Veja o 
Exercfcio 20.15. 


20.6 Exemplos ilustrativos 

Nesta segao, consideraremos algumas aplicagoes dos metodos de equagoes simultaneas. 


17 Mas atengao: a SQR restrita e a nao restrita no numerador devem ser calculadas utilizando o Yprevisto (como 
no Estagio 2 dos MQ2E) e a SQR no denominador e calculada utilizando os valores reais dos regressores em vez 
dos valores previstos. Para uma discussao acessivel desse assunto, veja WALLACE, T. Dudley; SILVER, J. Lew. 
Econometrics: an introduction. Reading, Mass.: Addison-Wesley, 1988. sec. 8.5. 
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EXEMPLO 20.1 

Propaganda, 
concentragao e 
margens de 
prego 


TABELA 20.3 

Estimativas de 
MQO de tres 
equagoes (razoes t 
entre parenteses) 


Para estudar as inter-relagoes entre a propaganda, a concentragao (como mensurada pela 
razao de concentragao) e as margens de custo-prego, Allyn D. Strickland e Leonard W. Weiss 
formularam o seguinte modelo de tres equagoes. 18 

Fungao intensidade da propaganda: 

Ad/5= o 0 + oi M + o 2 (CD/S)+ a 3 C + a 4 C 2 + o 5 Gr+ o 6 Dur 

Fungao concentragao: 

C= b 0 + <bi(Ad/5)+ b 2 (MES/5) 

Fungao margem de custo-prego: 

M= c 0 + c n (/C/5) + c 2 Gr + c 3 C+ c 4 GD + c s (Ad/5) + c 6 (MES/5) 

em que Ad = gastos com propaganda 
S = valor de transporte 

*C = razao de concentragao de quatro empresas 
CD = demanda do consumidor 
MES = escala minima eficiente 
M = margem de prego/custo 

Gr = taxa anual de crescimento da produgao industrial 
Dur = variavel binaria para a industria de bens duraveis 
K = estoque de capital 

GD = medida da dispersao geografica da produgao 

Pelas condigoes de ordem para a identificagao, a Equagao e superidentificada, enquanto 
as Equagoes (20.6.1) e (20.6.3) sao exatamente identificadas. 

Os dados para a analise originam-se, em sua maior parte, do Censo das Empresas Manu- 
fatureiras, de 1963, que engloba 408 das 41 7 industrias de quatro dfgitos. As tres equagoes 
foram primeiro estimadas pelos MQO, produzindo os resultados exibidos na Tabela 20.3. 
Para corrigir o vies das equagoes simultaneas, os autores reestimaram o modelo utilizando os 
MQ2E. Os resultados decorrentes estao na Tabela 20.4. Deixamos esses resultados para que 
o leitor compare os dois resultados. 


( 20 . 6 . 1 ) 

( 20 . 6 . 2 ) 

( 20 . 6 . 3 ) 


Variavel dependente 



Ad/5 

C 

M 


Equagao (20.6.1) 

Equagao (20.6.2) 

Equagao (20.6.3) 

Constante 

-0,0314 (- 7,45) 

0,2638 (25,93) 

0,1682 (1 7,15) 

C 

0,0554 (3,56) 

— 

0,0629 (2,89) 

C 2 

-0,0568 (- 3,38) 

— 

— 

M 

0,1123 (9,84) 

— 

— 

CD/S 

0,0257 (8,94) 

— 

— 

Gr 

0,0387 (1,64) 


0,2255 (2,61) 

Dur 

-0,0021 (-1,11) 

— 

— 

Ad/5 

— 

1,1613 (3,3) 

1,6536 (11,00) 

MES/5 

— 

4,1852 (18,99) 

0,0686 (0,54) 

K/S 

— 

— 

0,1123 (8,03) 

CD 

— 

— 

-0,0003 (-2,90) 

R 2 

0,374 

0,485 

0,402 

df 

401 

405 

401 


(' Continua ) 


,8 Veja "Advertising, Concentration, and Price-Cost Margins." ]ournal of Political Economy, v. 84, n. 5, p. 
1.109-121, 1976. 

*N. de R.T.: razao de concentragao das quatro maiores empresas (conhecida como R4). 
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EXEMPLO 20.1 

( Continuagdo ) 





TABELA 20.4 



Variavel dependente 


Estimativas de 
mmimos 

quadrados de dois 
estagios das tres 
equagoes (razoes t 
entre parenteses) 

Constante 

C 

C 2 

Ad/5 

Equagao (20.6.1) 

-0,0245 (- 3,86) 
0,0737 (2,84) 
-0,0643 (-2,64) 

C 

Equagao (20.6.2) 

0,2591 (21,30) 

M 

Equagao (20.6.3) 

0,1736 (14,66) 
0,0377 (0,93) 


M 

0,0544 (2,01) 

— 

— 

CD/S 

0,0269 (8,96) 

— 

— 

Gr 

0,0539 (2,09) 

— 

0,2336 (2,61) 

Dur 

-0,0018 (-0,93) 

— 

— 

Ad/5 

— 

1,5347 (2,42) 

1,6256 (5,52) 

MES/5 

— 

4,169 (18,84) 

0,1720 (0,92) 

K/S 

— 

— 

0,1165 (7,30) 

CD 

— 

— 

-0,0003 (-2,7? 


EXEMPLO 20.2 

Modelo I de 
Klein 


No Exemplo 18.6, discutimos rapidamente o modelo pioneiro de Klein. Inicialmente, 
o modelo foi estimado para o perfodo de 1 920-1 941. Os dados sublinhados sao apresen- 
tados na Tabela 20.5; as estimativas de MQO, na forma reduzida, e MQ2E sao dadas na 
Tabela 20.6. Deixamos para o leitor a interpretagao desses resultados. 


TABELA 20.5 

Dados originais do 
modelo I de Klein 

Fonte: estes dados foram 
extraidos de 
MADDALA, G. S. 
Econometrics. Nova 
York: McGraw-Hill, 
1977, p. 238. 


Ano 

C* 

P 

W 

/ 

K_, 

X 

W' 

G 

T 

1920 

39,8 

12,7 

28,8 

2,7 

180,1 

44,9 

2,2 

2,4 

3,4 

1921 

41,9 

12,4 

25,5 

-0,2 

182,8 

45,6 

2,7 

3,9 

7,7 

1922 

45,0 

16,9 

29,3 

1,9 

182,6 

50,1 

2,9 

3,2 

3,9 

1923 

49,2 

18,4 

34,1 

5,2 

184,5 

57,2 

2,9 

2,8 

4,7 

1924 

50,6 

19,4 

33,9 

3,0 

189,7 

57,1 

3,1 

3,5 

3,8 

1925 

52,6 

20,1 

35,4 

5,1 

192,7 

61,0 

3,2 

3,3 

5,5 

1926 

55,1 

19,6 

37,4 

5,6 

197,8 

64,0 

3,3 

3,3 

7,0 

1927 

56,2 

19,8 

37,9 

4,2 

203,4 

64,4 

3,6 

4,0 

6,7 

1928 

57,3 

21,1 

39,2 

3,0 

207,6 

64,5 

3,7 

4,2 

4,2 

1929 

57,8 

21,7 

41,3 

5,1 

210,6 

67,0 

4,0 

4,1 

4,0 

1930 

55,0 

15,6 

37,9 

1,0 

215,7 

61,2 

4,2 

5,2 

7,7 

1931 

50,9 

11,4 

34,5 

-3,4 

216,7 

53,4 

4,8 

5,9 

7,5 

1932 

45,6 

7,0 

29,0 

-6,2 

213,3 

44,3 

5,3 

4,9 

8,3 

1933 

46,5 

11,2 

28,5 

-5,1 

207,1 

45,1 

5,6 

3,7 

5,4 

1934 

48,7 

12,3 

30,6 

-3,0 

202,0 

49,7 

6,0 

4,0 

6,8 

1935 

51,3 

14,0 

33,2 

-1,3 

199,0 

54,4 

6,1 

4,4 

7,2 

1936 

57,7 

17,6 

36,8 

2,1 

197,7 

62,7 

7,4 

2,9 

8,3 

1937 

58,7 

17,3 

41,0 

2,0 

199,8 

65,0 

6,7 

4,3 

6,7 

1938 

57,5 

15,3 

38,2 

-1,9 

201,8 

60,9 

7,7 

5,3 

7,4 

1939 

61,6 

19,0 

41,6 

1,3 

199,9 

69,5 

7,8 

6,6 

8,9 

1940 

65,0 

21,1 

45,0 

3,3 

201,2 

75,7 

8,0 

7,4 

9,6 

1941 

69,7 

23,5 

53,3 

4,9 

204,5 

88,4 

8,5 

13,8 

11,6 


*A interpreta?ao das variaveis esta no Exemplo 18.6. 


( Continua ) 
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EXEMPLO 20.2 

( Continuagao ) 

TABELA 20.6* 

Estimativas MQO, 
na forma reduzida, 
e MQ2E do 
modelo I, de Klein 

Fonte: MADDALA, G. 
S. Econometrics. Nova 
York: McGraw-Hill, 
1977. p. 242. 


MQO: 

C = 16,237 + 0,193P + 0,796(W+ W')+ 0,089P_! 

(1,203) (0,091) (0,040) (0,090) 

t= 10,125 + 0,479P + 0,333P_i - 0,112/C_i 
(5,465) (0,097) (0,100) (0,026) 

W= 0,064 + 0,439X + 0,146X_i + 0,130 1 
(1,151) (0,032) (0,037) (0,031) 

Forma reduzida: 

P = 46,383 + 0,81 3P_i - 0,213/C, + 0,015X 
(10,870) (0,444) (0,067) (0,252) 


W+ W' = 40,278 + 0,823P_i - 0,144/C, + 0,115X_, 
(8,787) (0,359) (0,054) (0,204) 


1,724P_, 

(0,771) 


X = 78,281 
(18,860) 

MQ2E: 

C = 16,543 + 0,019P + 


0,31 9/C, + 0,094X_i 
(0,110) (0,438) 


0,810(W+ W') + 0,214P_, 


(1,464) (0,130) (0,044) (0,118) 

f = 20,284 + 0,149P + 0,616P_, - 0,157/C, 
(8,361) (0,191) (0,180) (0,040) 

W = 0,065 + 0,438X + 0,146X_i + 0,130t 
(1,894) (0,065) (0,070) (0,053) 


R = 0,978 DW= 1,367 


R = 0,919 DW = 1,810 


R = 0,985 DW= 1,958 


l + 


0,297t - 
(0,154) 
R 2 


- 0,926 T+ 0,443C 
(0,385) (0,373) 

= 0,753 DW = 1,854 
+ 0,881 1- 0,5677 + 0,859G 
(0,311) (0,302) 

0,949 DW= 2,395 
0,878t- 0,5657+ 1,317C 
(0,669) (0,648) 

0,882 DW = 2,049 

0,9726 


(0,124) 
R 2 = 


(0,267) 
R 2 = 

r 2 = 


R = 0,8643 


R = 0,9852 


*A interpretagao das variaveis esta listada no Rxemplo 18.6 (erros-padrao estao entre parenteses) 


EXEMPLO 20.3 

O modelo CAPM 
(Capital Asset 
Pricing Model) 
como um sistema 
recursivo 


Em uma aplicagao especialmente incomum de modelagem de equa^ao simultanea recur- 
siva, Cheng F. Lee e W. P. Lloyd 19 estimaram o seguinte modelo para a industria petrolffera: 


Pit= a, 

+ yiM t + u u 

/? 2 t= a 2 + folPlt 

+ y 2 M t + u 2t 

Rst= as + Pst Rft+ &32R2t 

+ YiMt+ Uit 


R4t- “4+ Al^1t + P4lR2t+ ^4lRit 


+ y 4 M t + U41 


Rst= as + ^5,P,t + PslRlt+ ft5lRlt+ /?54P4t 


+ y s M t + Ust 


R6t- “6+ /S6lPlt+ ^6lR2t+ P6lRlt+ &64R4t+ f^6sRst + 76^+ U(,t 


R?t- “7+ ^71 Pi t + P72R2t+ P7-sRlt+ ^74^41+ /*75^5t+ ^76^6t + 77 + Uy t 


em que R , = taxa de retorno sobre tftulo 1 ( = Imperial Oil) 

R 2 = taxa de retorno sobre tftulo 2 ( = Sun Oil) 


R 7 = taxa de retorno sobre tftulo 7 ( = Standard of Indiana) 

M f = taxa de retorno sobre o fndice de mercado 
Uj, = termos de disturbios (/ = 1, 2, . . ., 7) 

( Continua ) 


19 "The capital asset pricing model expressed as a recursive system: an empirical investigation." Journal of Financial 
and Quantitative Analysis, jun. 1976. p. 237-249. 
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EXEMPLO 20.3 

(Continuagdo) 


Antes de apresentarmos os resultados, a questao obvia e: como escolhemos qual e o tftu- 
lo 1, qual e o tftulo 2 e assim por diante? Lee e Lloyd respondem a essa pergunta de forma 
puramente empfrica. Eles regridem a taxa de retorno do tftulo / sobre as taxas de retorno dos 
seis tftulos remanescentes e observam o resultado R 2 . Portanto, havera sete dessas regressoes. 
Eles ordenam os valores R 2 estimados a partir do menor para o maior. O tftulo que tiver o 
menor R 2 e designado tftulo 1 e o que tem o maior R 2 e designado tftulo 7. A ideia por tras 
disso e intuitivamente simples. Se o R 2 da taxa de retorno da Imperial Oil for o menor em 
rela^ao aos outros seis tftulos, isso sugere que ele seja o menos afetado pelas variagoes nos 
retornos dos outros tftulos. Sendo assim, a ordena^ao causal, se houver, opera a partir desse 
tftulo para os outros e nao ha feedback a partir de outros tftulos. 

Embora se possa questionar tal abordagem puramente empfrica para a ordena^ao causal, 
vamos apresentar, nao obstante, os seus resultados empfricos, dados na Tabela 20.7. 

No Exercfcio 5.5, introduzimos a linha caracterfstica da moderna teoria do investimento, 
que e simplesmente a regressao da taxa de retorno do tftulo / sobre a taxa de retorno de 
mercado. O coeficiente angular, conhecido como coeficiente beta, e uma medida da volati- 
lidade do retorno do tftulo. O que os resultados da regressao Lee-Lloyd sugerem e que ha 
relates intraindustrias significativas entre retornos de tftulos, sem considerar a influencia 
do mercado comum representada pela carteira de mercado. Portanto, o retorno da Standard 
of Indiana depende nao apenas das taxas de retorno de mercado, mas tambem das taxas 
de retorno da Shell Oil, da Phillips Petroleum e da Union Oil. Em outras palavras, o movi- 
mento na taxa de retorno da Standard of Indiana pode ser mais bem explicado, se alem da 
taxa de retorno de mercado, tambem considerarmos as taxas de retorno experimentadas 
pela Shell Oil, Phillips Petroleum e Union Oil. 


TABELA 20.7 

Estimativas do 
sistema recursivo 
para a industria do 
petroleo 

Fonte: LEE, Cheng F.; 
LLOYD, W. P. op. cit. 
tabela 3b. 


Forma line 

Variaveis dependentes 



Standard 

Shell 

Phillips 

Union 

Standard 

Sun 

Imperial 


of Indiana 

Oil 

Petroleum 

Oil 

of Ohio 

Oil 

Oil 

Standard 
of Indiana 
Shell Oil 

0,2100* 

(2,859) 







Phillips 

0,2293* 

0,0791 






Petroleum 

(2,176) 

(1,065) 






Union Oil 

0,1754* 

0,2171* 

0,2225* 






(2,472) 

(3,177) 

(2,337) 





Standard 

-0,0794 

0,0147 

0,4248* 

0,1468* 




of Ohio 

(-1,294) 

(0,235) 

(5,501) 

(1,735) 




Sun Oil 

0,1249 

0,1710* 

0,0472 

0,1339 

0,0499 




(1,343) 

(1,843) 

(0,355) 

(0,908) 

(0,271) 



Imperial Oil 

-0,1077 

0,0526 

0,0354 

0,1580 

-0,2541* 

0,0828 



(-1,412) 

(0,6804) 

(0,319) 

(1,290) 

(-1,691) 

(0,971) 


Constate 

0,0868 

-0,0384 

-0,0127 

-0,2034 

0,3009 

0,201 3 

0,3710* 


(0,681) 

(1,296) 

(- 0,068) 

(0,986) 

(1,204) 

(1,399) 

(2,161) 

Market index 

0,3681* 

0,4997* 

0,2884 

0,7609* 

0,9089* 

0,7161* 

0,6432* 


(2,165) 

(3,039) 

(1,232) 

(3,069) 

(3,094) 

(4,783) 

(3,774) 

R 2 

0,5020 

0,4658 

0,4106 

0,2532 

0,0985 

0,2404 

0,1247 

Durbin- 

Watson 

2,1083 

2,4714 

2,2306 

2,3468 

2,2181 

2,3109 

1,9592 


*Denota significancia no nivel 0,10 ou melhor para o teste bicaudal. 
Note: os valores t aparecem em parenteses abaixo dos coeficientes. 
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EXEMPLO 20.4 

Forma revisada 
do modelo St. 
Louis 20 


O bastante conhecido, e frequentemente controverso, modelo St. Louis desenvolvido 
originalmente no fim da decada de 1960 foi revisado de tempos em tempos. Essa revisao 
e dada na Tabela 20.8 e os resultados empfricos baseados nesse modelo revisado estao na 
Tabela 20.9. ( Nota: um ponto sobre uma variavel significa o crescimento da taxa daquela 
variavel.) O modelo consiste basicamente nas Equagoes (1), (2), (4) e (5); na Tabela 20.8, 
as outras equagoes representam as definigoes. A Equagao (1) foi estimada pelos MQO. As 
Equagoes (1), (2) e (4) foram estimadas utilizando o metodo das defasagens distribuf- 
das de Almon com restrigoes (ponto extremo) sobre os coeficientes. Quando relevante, 
as equagoes foram corrigidas para correlagao serial de primeira ordem (pi) e/ou de se- 
gunda ordem (p2). 

Examinando os resultados, observamos que e a taxa de crescimento da oferta de moeda 
que primeiro determina a taxa de crescimento (nominal) do PIB e nao a taxa de crescimen¬ 
to nos gastos com a alta taxa de emprego. A soma dos coeficientes Me 1,06, sugerindo que 
1% (sustentado) de aumento na oferta de moeda, em media, leva a cerca de 1,06% de 
aumento no PNB nominal. Por outro lado, a soma dos coeficientes E, cerca de 0,05, sugere 
que uma mudanga nos gastos governamentais com alta taxa de emprego tern menos im- 
pacto sobre a taxa de crescimento do PNB nominal. Deixamos para o leitor interpretar os 
resultados das outras regressoes apresentadas na Tabela 20.9. 


TABELA 20.8 


4 4 

O modelo St. 

(D 

Y^ = n + ECH(M f -/)+ £CE(E t -/)+«1t 

/= 0 i= 0 

Louis 


4 5 

Fonte: Federal Reserve 

(2) 

Pt= C 2 + J2 CPE,(PE t _/) + £CD,(X t _,-XFr_n) 

Bank of St. Louis, 


/=1 i=0 

Review, p. 14, maio 


+ CPA (PA t )+ CDUMI(DUMI) + CDUM2(DUM2)+ e2 t 

1982. 

(3) 

PAt = ECPRL ,(P t _,) 


(4) 

1=1 20 

RLt = C3+ £ CPRL,(P t -,)+ e3 t 
/-o 


(5) 

U t - UF( = CC(GAP t )+ CC1(GAP t _ 1 )+ e4 t 


(6) 

Y t = (P t /100)(X t ) 


(7) 

o 

o 

1 

"4- 

II 


(8) 

Xf = [(X t /X t _,) 4 - 1 ] 100 


(9) 

Pt= IWPt-Y- 1]100 


(10) 

GAP t = [(XF t /X t )/XF t ]1 00 


(11) 

XF?= [(XFi/Xt-O 4 - 1]100 


Y = PNP nominal 
M= estoque de moeda (Ml) 

E = gastos altos com emprego 
P = deflator do PNB (1972 = 100) 
PE = pre?o relativo da energia 
X= produQao em dolares de 1972 


XF = produto potencial (Rasche/Tatom) 

RL = classificagao de titulo corporativo 
U = taxa de desemprego 

UF = taxa de desemprego no ponto de pleno emprego 
DUM1 = variavel binaria de controle (1971—III a 1973-1 = 1; 0 em todos os demais) 
DUM2 = variavel binaria de pos-controle (1973—11 a 1975—1 = 1; 0 em todos os demais) 


( Continua ) 


20 


Federal Reserve Bank of St. Louis, Review, maio 1982. p. 14. 
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EXEMPLO 20.4 

( Continua ) 


TABELA 20.9 

Estimagao dentro 
da amostra: 1960-1 
ate 1980-IV (valor 
absoluto da 
estatlstica t entre 
parenteses) 

Fonte: Federal Reserve 
Bank of St. Louis, 
Review, p. 14, maio 
1982. 


(1) Vf = 2,44 + 0,40 M t + 0,39A4 t _i + 0,22/W t _ 2 + 0,06/W t _ 3 - 0,01 M t _ 4 

(2,15) (3,38) (5,06) (2,18) (0,82) (0,11) 

+ 0,06E t + 0,02ft-! - 0,02 E t - 2 - 0,02 £ t _ 3 + 0,01 E t _ 4 
(1,46) (0,63) (0,57) (0,52) (0,34) 

R 1 2 3 4 5 6 7 = 0,39 ep= 3,50 DW=2,02 

(2) P t = 0,96+ 0,01 PE t _i + 0,04PE t _ 2 - 0,01PE,_ 3 + 0,02PE f _ 4 

(2,53) (0,75) (1,96) (0,73) (1,38) 

- 0,00(X t - XF*) + 0,01 (Xt-i- XF?_0 + 0,02(X t _2- XF?_ 2 ) 

(0,18) (1,43) (4,63) 

+ 0,02(Xf_ 3 - XF?_ 3 ) + 0,02(X t _ 4 - XF?_4 + 0,01 (X t _s- XF?_ 5 ) 

(3,00) (2,42) (2,16) 

+ 1,03(PA t ) - 0,61 (DUMIf) + 1,65(DUM2 t ) 

(10,49) (1,02) (2,71) 

R 2 = 0,80 ep= 1,28 DW=1,97 p = 0,12 

_ 20 

(4) RL t = 2,97 + 0,96£ Pt-i 

(3,12) (5,22)° 

R 2 = 0,32 ep = 0,33 DW=1,76 p = 0,94 

(5) u7^UF t = 0,28(CAP,)+ 0,14(GAPt_!) 

(11,89) (6,31) 

R 2 = 0,63 ep = 0,17 DW=1,95 Pi = 1,43 p 2 = 0,52 


Resumo e 
conclusoes 


1. Presumindo que lima equa 9 ao em um modelo de equa 9 oes simultaneas seja identificada (exata- 
mente ou superidentificada), temos varios metodos para estima-la. 

2. Esses metodos estao em duas amplas categorias: metodos de equa 9 §o unica e metodos de sistemas. 

3. Por razoes de economia, erros de especifica 9 ao etc., os metodos de equa 9 ao unica sao, de longe, 
os mais populares. Uma caracteristica exclusiva desses metodos e que podemos estimar uma 
equa 9 ao unica em um modelo multiequacional sem ficarmos muito preocupados com as outras 
equa 9 oes do sistema. ( Nota: para propositos de identifica 9 ao, contudo, as outras equa 9 oes no 
sistema contam.) 

4. Os tres metodos de equa 9 ao unica normalmente utilizados sao MQO, MQI e MQ2E. 

5. Embora os MQO sejam, em geral, inapropriados no contexto dos modelos de equa 9 oes simulta¬ 
neas, eles podem ser aplicados para os chamados modelos recursivos nos quais ha uma rela 9 ao 
de causa e efeito definitiva, mas nao unidirecional, entre as variaveis endogenas. 

6. O metodo de MQI e apropriado para as equa 9 oes apenas identificadas ou exatamente identifica- 
das. Nesse metodo, os MQO sao aplicados a equa 9 ao na forma reduzida e e com base nos coefi- 
cientes na forma reduzida que se estimam os coeficientes estruturais originais. 

7. O metodo de MQ2E e especialmente projetado para equa 9 oes superidentificadas, embora possa 
tambem ser aplicado as equa 9 oes exatamente identificadas. Desse modo, os resultados de MQ2E e 
MQI sao identicos. A ideia basica subjacente ao metodo MQ2E e substituir a variavel explanatoria 
endogena (estocastica) por uma combina 9 ao linear das variaveis predeterminadas no modelo e 
utilizar essa combina 9 ao como a variavel explanatoria em vez da variavel endogena original. O 
metodo MQ2E assemelha-se, portanto, ao metodo variavel instrumental de estima 9 ao, no qual a 
combina 9 ao linear das variaveis predeterminadas serve como instrumento, ou proxy , para o regres¬ 
sor endogeno. 






724 Parte Quatro Modelos de equagdes simultaneas e econometria de series temporais 


EXERCICIOS 


8. Uma caracterfstica notavel tanto dos MQI como dos MQ2E e que as estimativas obtidas sao con- 
sistentes, isto e, a medida que o tamanho da amostra aumenta indefinidamente, as estimativas 
convergem para os valores reais da popula 9 ao. As estimativas nao podem satisfazer as proprie- 
dades de amostras pequenas, tais como a tendenciosidade e a variancia minima. Entretanto, os 
resultados obtidos por meio da aplica§ao desses metodos em amostras pequenas e as inferences 
extrafdas por meio deles deveriam ser interpretados com o devido cuidado. 


20.1. Determine se as seguintes afirma 9 oes sao verdadeiras ou falsas: 

a. O metodo de MQO nao e aplicavel para estimar uma equa§ao estrutural em um modelo de 
equa 9 oes simultaneas. 

b. No caso de uma equa 9 ao nao ser identificada, o MQ2E nao e aplicavel. 

c. O problema da simultaneidade nao aumenta em um modelo recursivo de equa 9 oes 
simultaneas. 

d. Os problemas de simultaneidade e exogeneidade significant a mesma coisa. 

e. O MQ2E e outros metodos para estimar equa 9 oes estruturais possuem propriedades esta- 
tfsticas desejaveis apenas para amostras grandes. 

f Nao ha algo como um R * 1 para o modelo de equa 9 oes simultaneas como um todo. 

g. O MQ2E e outros metodos para estimar as equa 9 oes estruturais nao sao aplicaveis se os 
erros das equapoes sao autocorrelacionados e/ou correlacionados entre as equa95es. 

h. Se uma equapao e exatamente identificada, MQI e MQ2E oferecem resultados identicos. 

20.2. Por que e desnecessario aplicar o metodo de mmimos quadrados em dois estagios para as 
equa 9 oes exatamente identificadas? 

20.3. Considere o seguinte modelo keynesiano modificado para a determina 9 ao de renda: 

C t = fiio + PuY t + u\ t 

It = P 20 + Pi\Y t + P 22 Y t ~ 1 + U 2 t 

Y t = C t + I, + G t 

em que C — gastos com consumo 

I — gastos de investimento 
Y — renda 

G = gastos do governo 

G, e Y,_i sao supostamente predeterminadas. 


a. Obtenha as equa 9 oes na forma reduzida e determine quais das equa 9 oes anteriores sao 
identificadas (apenas identificadas ou superidentificadas). 

b. Qual metodo voce utilizara para estimar os parametros da equa 9 ao superidentificada e da 
equa 9 ao exatamente identificada? Justifique sua resposta. 

20.4. Considere os seguinte resultados^ 


MQO : W, = 0,276 + 0,258P, + 0,0467V 
MQO: P, = 2,693 + 0,232^ - 0,544X, 
MQ2E: W, = 0,272 + 0,2577’, + 0,0467’,- 
MQ2E: P, = 2,686 + 0,233 IE, - 0,544X, 


+ 4,959 V, R 2 = 0,924 

+ 0,247M, + 0,064M,_, R 2 = 0,982 
+ 4,966V, R 2 = 0,920 

+ 0,246 M, + 0,046M,_! R 2 = 0,981 


‘Opcional. 

^ Fonte: Prices and earnings in 1951-1969: an econometric assessment. Londres: Department of Employment, 
United Kingdom, Her Majesty's Stationery Office, 1971. p. 30. 
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em que W t , P t , M t e X t sao variagoes percentuais em ganhos, pregos, pregos de importagao 


e produtividade da mao de obra (todas as mudangas de percentagem dizem respeito ao ano 
anterior), respectivamente, e V, representa as vagas de emprego nao preenchidas (porcentagem 
do numero total de empregados). 

“Uma vez que os resultados de MQO e MQ2E sao praticamente identicos, o MQ2E nao tem 
sentido”. Comente. 

* 20.5. Suponha que a produgao seja caracterizada pela fungao de produgao Cobb-Douglas 



em que Q = produgao 

K — insumo de capital 
L — insumo de mao de obra 
A, a e 16 — parametros 

i — i-esima empresa 

Dado o prego do produto final P, o prego do trabalho Weo prego do capital R, e supondo a 
maximizagao do lucro, obtemos o seguinte modelo empirico de produgao: 

Fungao produgao : 


In Qj = In A + a In K t + fi In L t + \nu\ t 


0) 


Produto marginal da fungao mao de obra: 

W 

In Qi - - \nf+ In L t + In — + Xn uu 

Produto marginal da fungao capital: 

In Qi = - In a + In K t + In-1- In 


( 2 ) 


(3) 


em que U\, U 2 e u 3 sao disturbios estocasticos. 

No modelo anterior, ha tres equagoes nas variaveis endogenas Q, Le K. P, R e W sao exogenas. 

a. Quais problemas voce encontra na estimagao do modelo se a + ft — 1, isto e, quando ha 
retornos constantes de escala? 

b. Mesmo se a + f F 1, voce pode estimar as equagoes? Responda considerando a identifica- 
bilidade do sistema. 

c. Se o sistema nao e identificado, o que pode ser feito para identifica-lo? 

Nota: as Equagoes (2) e (3) sao obtidas por meio da diferenciagao de Q em relagao a mao de 
obra e ao capital, respectivamente, o que as torna iguais a W/P e R/P, transformando as expres- 
soes resultantes em logaritmos e adicionando (o logaritmo dos) termos de disturbio. 

20.6. Considere o seguinte modelo de demanda e oferta de moeda: 

Demanda de moeda: Mf = fo+ j5\Y\ + fcRt + PzPt + u\t 
Oferta de moeda: M s t = ao + a\ Y, + un 

em que M — dinheiro 
Y = renda 
R — taxa de juros 
P — prego 
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Suponha que R e P sejam predeterminadas. 

a. A fungao demanda e identificada? 

b. A fungao oferta e identificada? 

c. Qual metodo voce usaria para estimar os parametros da(s) equagao(Ses) identificada(s)? 
Por que? 

d. Suponha que modifiquemos a fungao oferta ao adicionarmos as variaveis explanatorias Y t _ , 
e M,_j. O que acontece com o problema de identificagao? Voce ainda utilizaria o metodo 
usado em (c)? Explique sua resposta. 

20.7. Retome o Exercicio 18.10. Para o sistema de duas equagoes obtenha as equagoes na forma 
reduzida e estime parametros delas. Estime a regressao dos minimos quadrados indiretos de 
consumo sobre a renda e compare os resultados com a regressao por MQO. 

Exercfcios aplicados 

20.8. Considere o seguinte modelo: 

Rt - Po + fi\M t + fi 2 Y t + u\ t 
Y t = ao + ot\Rt + u 2 t 

em que M, (oferta de moeda) e exogena, R,e a taxa de juros e K,eo PIB. 

a. Como voce justificaria o modelo? 

b. As equagoes sao identificadas? 

c. Utilizando os dados da Tabela 20.2, estime os parametros das equagoes identificadas. 
Justifique o(s) metodo(s) usado(s) por voce. 

20.9. Imagine que mudemos o modelo no Exercicio 20.8 como se segue: 

Rt = Po+ + p 2 Y t + PiY t -1 + Mi, 

Y t — c/q + ci\R t + u 2t 

a. Descubra se o sistema e identificado. 

b. Utilizando os dados da Tabela 20.2, estime os parametros da(s) equagao(oes) identi¬ 
ficadas. 

20.10. Considere o seguinte modelo: 

Rt = Po + P\M t + p 2 Y, + mi, 

Y t = a o + ot\R t + a 2 /, + u 2 t 

em que as variaveis sao semelhantes as definidas no Exercicio 20.8. Tratando I (investimen- 
to interno) e M como exogena, determine a identificagao do sistema. Utilizando os dados da 
Tabela 20.2, estime os parametros da(s) equagao(oes) identificada(s). 

20.11. Suponha que modifiquemos o modelo do Exercicio 20.10 como se segue: 

Rt - Po+ PiM, + P 2 Y t + mi , 

Y t = ao + d\R t + d 2 I t + u 2t 
h = To + Y\Rt + u 2t 

Suponha que M seja determinada exogenamente. 

a. Descubra quais das equagoes sao identificadas. 

b. Estime os parametros da(s) equagao(oes) identificada(s) utilizando os dados da Tabela 
20.2. Justifique o(s) seu(s) metodo(s). 

20.12. Verifique os erros padrao apresentados na Equagao (20.5.3). 
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20.13. Retorne ao modelo de demanda e oferta fornecido nas Equaqoes (20.3.1) e (20.3.2). Suponha 
que a funqao oferta seja alterada como se segue: 


Qt - Po + PiPt- i + u 21 


em que P,_ x e o prcco que prevalece no perfodo anterior. 

a. Se X (gastos) e P,_i sao predeterminados, ha um problema de simultaneidade? 

b. Se houver, as fun 9 oes demanda e oferta sao identificadas? Se forem, obtenha as cquaqocs 
na forma reduzida e estime-as por meio dos dados da Tabela 20.1. 

c. Com base nos coeficientes de forma reduzida, voce pode derivar os coeficientes estrutu- 
rais? Mostre os calculos necessarios. 

20.14. Exercicio em classe. Considere o seguinte modelo macroeconomico simples para a econo- 
mia norte-americana, por exemplo, para o perfodo entre 1960-1999.' 

Fungao consumo privado: 


C t = ao + ai Y t + aiC t - \ + u\ t oi\ > 0 , 0 < 012 < 1 
Fungao investimento privado bruto: 

It - Po + A Y t + P2Rt + fait -1 + Uit Pi > 0, P2 < 0, 0 < /I3 < 1 

Uma fungao demanda por moeda: 

R t = Ao + /.; Vi + X- 2 Mt- ] + A3 Pt + A4 R(- 1 + U^t 

A} > 0, A2 < 0, A3 > 0, 0 < A4 < 1 


Identidade da renda: 


Yt - C t + I t + G t 

em que C — consumo privado real; I — investimento privado bruto real; G — gastos reais do 
governo; Y — PIB real; M — oferta de moeda M2 a pre 90 s correntes; R — taxa de juros de 
longo prazo (% e P — fndice de prcqos); ao consumidor. As variaveis endogenas sao C, I, R 
e Y. As variaveis predeterminadas sao C ,_,, I t _ h M ,_,, P,, R,_ { e G, mais o termo de inter- 
cepto. Os u sao os termos de erro. 

a. Utilizando a condipao de ordem de identificac^ao, determine qual das quatro cquapocs sao 
identificadas, sejam elas exatamente identificadas ou superidentificadas. 

b. Qual(is) metodo(s) voce utiliza para estimar as equates identificadas? 

c. Obtenha dados adequados por meio das fontes governamentais ou privadas, estime o 
modelo e comente seus resultados. 

20.15. Neste exercicio, examinamos os dados de 534 trabalhadores obtidos com base na Current 
Population Survey (CPS), de 1985. Os dados podem ser encontrados na Tabela 20.10 no site 
do livro. 1 As variaveis nesta tabela sao definidas como se segue: 

S = salarios, $, por hora; ocup = ocupaqao; setor = 1 para industria, 2 para constnujao civil, 
0 para outros; sindicato = 1 se membro de sindicato, 0 se nao for; educ = anos de escolari- 
dade; exper = experiencia profissional, em anos; idade = idade, em anos; genero = 1 para 
mulher; estado civil = 1 se casado; raqa = 1 para outra, 2 para hispanico, 3 para branco; re- 
giao = 1 se vive no Sul. 


'Adaptado de SEDDIGHI, H. R.; LAWLER, K. A.; KATOS, A. V. Econometrics: a practical approach. Nova York: 
Routledge, 2000. p. 204. 

fQs dados podem ser encontrados na internet, em http://lib.stat.cmu.edu/datasets/cps_85_wages. 
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Considere o modelo simples de determinafao de salario: 

In 5 = + /^Educ + yS 3 Exper+ ^Exper 2 + w, (1) 

a. Suponha que a educaqao, como os salarios, seja endogena. Como voce descobriria se na 
Equaqao (1) a educa£ao e de fato endogena? Utilize os dados fornecidos na tabela em sua 
analise. 

b. O teste de Hausman sustenta sua analise em (a)? Explique detalhadamente. 

20.16. Exercicio em classe. Considere o seguinte modelo de demanda e oferta para os emprestimos 

bancarios para o comercio: 

Demanda: Q d t = a\ + o?2?^ + ci^RDf + oqlPI, + u\ t 
Oferta: Q] — f> i + fiiRt + /63R S? + ^TBD; + uu 

em que Q — total de emprestimos comerciais bancarios (em bilhoes de dolares); R — taxa 

primaria media; 

RS = taxa de letras do Tesouro de tres meses; RD = taxa de tltulos corporativos com clas- 

sificafao AAA; 

IPI = Indice de Produ 5 ao Industrial; e TDB = total de depositos bancarios. 

a. Colete dados sobre essas variaveis no perfodo entre 1980 e 2007 com base em varias 
fontes, como o www.economagic.com, o site do Federal Reserve Bank de St. Louis, ou 
outra fonte qualquer. 

b. As fungoes demanda e oferta sao identificadas? Liste quais variaveis sao endogenas e 
quais sao exogenas. 

c. Como voce estimaria as fun 5 oes demanda e oferta listadas a seguir? Mostre os calculos 
necessarios. 

d. Por que tanto R quanto RS estao incluldas no modelo? Qual o papel do IPI no modelo? 


Apendice 20A 


20A.1 Vies nos estimadores de mmimos quadrados indiretos 


Para demonstrarmos que os estimadores de MQI, embora consistentes, sao viesados, utilizamos o modelo 
de demanda e oferta dados nas Equa§oes (20.3.1) e (20.3.2). Com base na Equa§ao (20.3.10), obtemos 


-Si 


ru 

fti 


Agora 


E 

E x . 


com base na Equagao (20.3.7) 


e 


fti 


J2pt x t 

Ed 


com base na Equa^ao (20.3.5) 


Entao, em substitui^ao, obtemos 

3 EdtXt 

Pi = - 

E Pi x t 


0) 
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Utilizando as Equagoes (20.3.3) e (20.3.4), obtemos 


p t = Tfix, + ( w t - w) 

(2) 

q, = n 3 x, + (v, - v) 

( 3 ) 


em que w e v sao os valores medios de w, e v„ respectivamente. Substituindo as Equagoes (2) e (3) pela Equa- 
gao (1), obtemos 

2 = n 3 Y.4 + E( v t ~ y) x t 

1 n i + E(™r - w)x t 

( 4 ) 

n 3 + E( v > - v)^r) X>f 

ni + - w)x t ) 


Uma vez que o operador de expectativa E e um operador linear, nao podemos tomar a expectativa da Equa- 
gao (4), embora seja claro que, em geral, 0[ ^ (n 3 /n 3 ). (Por que?) Mas, na medida em que o tamanho da 
amostra tende ao infinito, podemos obter 


plim (Pi) = 


plim n 3 + plim Yl( v t 


plimlli + plim ^2(w t 
em que se utilizam as propriedades de plim, a saber, que 


v) x t ) 

w) x,) Y^xj 


( 5 ) 


plim(j4 + B) = plim A + plim B and plim 



plim^ 
plim B 


Agora, a medida que o tamanho da amostra aumenta indefinidamente, o segundo termo tanto no denomina- 
dor quanto no numerador da Equagao (5) tende a zero (por que?), resultando em: 

n 3 

plim (ft )= — (6) 

o que mostra que, embora viesado, 0! e um estimador consistente de 


20A.2 Estima^ao de erros padrao dos estimadores de MQ2E 


O proposito deste apendice e demonstrar que os erros padrao das estimativas obtidas por meio da re- 
gressao de segundo estagio do procedimento de MQ2E, utilizando a formula aplicavel na estimagao por MQO, nao 
sao as estimativas “adequadas” dos “verdadeiros” erros padrao. Para tanto, utilizamos o modelo de oferta de 
renda-moeda fornecido nas Equagoes (20.4.1) e (20.4.2). Estimamos os parametros da fungao oferta de moeda 
superidentificada com base na regressao de segundo estagio como: 

Yit = 020 + 021 Pn + u* (20.4.6) 


em que 


u* = u 2t + 021 u, 


( 7 ) 


Agora, quando operamos a regressao (20.4.6), o erro padrao de, por exemplo, 0 2) e obtido por meio da se- 
guinte expressao: 


var(0 2 i) 



( 8 ) 


em que 


.2 _ U- t ) 2 _ Y(Y2t~ 020 - 021 Pll) 2 


n - 2 


n — 2 


( 9 ) 
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Mas a 2 * nao e a mesma coisa que , em que o ultimo e uma estimativa nao tendenciosa da variancia verda- 
deira de u 2 . Essa diferen?a pode ser prontamente verificada por meio da Equa?ao (7). Para obter o verdadeiro 
(como definido previamente) a 2 2 , procedemos como se segue: 

U2t = Y21 - 0 20 ~ 02 \Y\ t 

em que 0 2O e 02i sao as estimativas por meio da regressao de segundo estagio. Portanto, 

-2 _ £< 72 ,-/ 320 - PM 2 (m 

° U1 n - 2 ^ ’ 

Perceba a diferen?a entre as Equaqoes (9) e (10): na Equa<;ao (10), utilizamos o real em vez do Y l estimado 
por meio da regressao de primeiro estagio. 

Tendo estimada a Equaqao (10), o caminlio mais facil para corrigir os erros padrao dos coeficientes estimados 
na regressao de segundo estagio e multiplicar cada um deles por /a u Observe que, se Y lt e Y lt forem muito 
proximos, isto e, o R 2 na regressao de primeiro estagio for muito alto, o fator de correjao a Ul / a „* sera pro¬ 
ximo de 1, caso em que os erros padrao estimados na regressao de segundo estagio podem ser tornados como 
estimativas verdadeiras. Mas, em outras situa§oes, deveriamos usar o fator de corre§ao anterior. 





Capitulo 

Econometria de series 
temporais: alguns 
conceitos basicos 



Observamos no Capitulo 1 que um dos tipos importantes de dados utilizados em analises em- 
piricas sao os de series temporais. Neste e no capitulo seguinte, analisaremos com mais atengao 
esses dados nao apenas devido a frequencia com que sao usados, mas tambem porque apresentam 
varios desafios aos econometristas e aos praticantes de econometria. 

Primeiro, o trabalho empfrico baseado nos dados de series temporais supoe que a serie temporal 
subjacente seja estacionaria. Embora tenhamos discutido o conceito de estacionariedade intuitiva- 
mente no Capitulo 1, devemos discuti-lo mais amplamente neste capitulo. Mais especificamente, 
tentaremos descobrir o que a estacionariedade significa e por que devemos preocupar-nos com ela. 

Segundo, no Capitulo 12, sobre autocorrela£ao, discutimos varias causas da autocorrela£ao. Algu- 
mas vezes, a autocorrela 5 ao ocorre, porque a serie temporal subjacente e nao estacionaria. 

Terceiro, ao fazer a regressao para uma variavel de serie temporal em relagao a outra(s) variavel(is) 
de serie temporal, frequentemente obtem-se um R 2 muito elevado (superior a 0,9), muito embora nao 
haja rela^ao significativa entre as duas variaveis. Algumas vezes, nao esperamos relagao entre as duas 
variaveis, ainda que a regressao de uma sobre a outra frequentemente mostre uma relac^ao significativa. 
Essa situa?ao exemplifica o problema da regressao espuria, ou sem sentido, cuja natureza sera ex- 
plorada em breve. Portanto, e muito importante descobrir se uma relacao entre as variaveis economi¬ 
cas e espuria ou sem sentido. Veremos neste capitulo como as regressoes espurias podem aumentar 
se as series temporais nao forem estacionarias. 

Quarto, algumas series temporais financeiras, como os pre^os das a 9 oes, exibem o que e co- 
nhecido como fenomeno do passeio aleatorio. Isso significa que a melhor previsao do pre£o de 
uma agao, por exemplo, da IBM, amanha seja igual ao pre 50 de hoje mais um choque puramente 
aleatorio (ou termo de erro). Se esse for realmente o caso, prognosticar os pre<jos dos ativos seria 
um exercfcio inutil. 

Quinto, os modelos de regressao envolvendo os dados das series temporais sao com frequencia 
utilizados para previsoes. Em virtude da discussao anterior, devemos saber se a previsao e valida caso 
as series temporais fundamentadas nao sejam estacionarias. 

Porfim, os testes de causalidade (lembremos os testes de causalidade Granger e Sims, discutidos 
no Capitulo 17) pressupoem que as series temporais envolvidas na analise sejam estacionarias. Entre- 
tanto, os testes de estacionariedade deveriam preceder os testes de causalidade. 

Comecemos com uma advertencia. O topico da analise de series temporais e tao vasto e envolven- 
te, e parte da matematica que fundamenta as varias tecnicas de analise de series temporais e tao 
complexa que o maximo que podemos alcazar em um texto introdutorio como este e oferecer ao 
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leitor um vislumbre sobre alguns dos conceitos fundamentals da analise de series temporais. Para os 
que querem aprofundar-se no assunto, fornecemos references. 1 


21.1 Um olhar sobre algumas series temporais da economia dos 
Estados Unidos 

Para continuarmos o jogo e oferecermos ao leitor uma ideia sobre os conceitos um tanto eso- 
tericos da analise de series temporais a ser desenvolvida neste capftulo, sera util considerarmos 
varias series temporais da economia americana de interesse geral. As series temporais que consi- 
deraremos sao: 

RPD = renda real pessoal dispom'vel (bilhoes de dolares) 

PIB = produto interno bruto (bilhoes de dolares) 

DCP = despesas reais de consumo pessoal (bilhoes de dolares) 

LC = lucros corporativos (bilhoes de dolares) 

Dividendo = dividendos (bilhoes de dolares) 

O perfodo compreendido vai de 1947-1 a 2007-IV, totalizando 244 trimestres, e todos os dados sao 
sazonalmente ajustados a taxa anual. Todos os dados foram coletados no FRED, o site economico do 
Federal Reserve Bank, de St. Louis. PIB, RPD e DCP estao em dolares constantes, aqui em $ 2.000. O 
LC e o Dividendo estao em dolares nominais. 

Para economizar espa£o, os dados brutos estao postados no site do livro. Mas, para ter alguma ideia 
sobre esses dados, nos os organizamos nas duas figuras que se seguem. A Figura 21.1 apresenta os 
dados dos logaritmos de PIB, RPD e DCP e a Figura 21.2 apresenta os dados dos logaritmos de outras 
duas series temporais (LC e Dividendos). E pratica comum representar o logaritmo de uma serie tem¬ 
poral para ter uma no?ao da taxa de crescimento da mesma. Um grafico dos dados e nonnalmente o 
primeiro passo na analise das series temporais. Nessas figuras, a letra L indica um logaritmo natural. 

A primeira impressao que temos das duas figuras e que todas essas series temporais parecem apre- 
sentar uma tendencia ascendente, embora tenham fhituagoes. Suponha que queiramos especular so¬ 
bre o formato dessas curvas alem do perfodo de amostragem, por exemplo, por todos os trimestres de 
2008. 2 Poderemos fazer isso se conhecermos o mecanismo estatlstico ou o processo gerador de 
dados (PGD) responsavel por essas curvas. Mas o que e esse mecanismo? Para respondermos a essa 
e a outras questoes relacionadas, precisamos estudar um “novo” vocabulario desenvolvido pelos 
analistas de series temporais, para o qual agora nos voltaremos. 


1 No nfvel introdutorio, essas references podem ser uteis: KOOP, Gary. Analysis of economic data. Nova York: John 
Wiley & Sons, 2000; CROMWELL, Jeff B.; LABYS Walter C.; TERRAZA, Michel. Univariate tests for time series mo¬ 
dels. California, Ansbury Park: Sage Publications, 1994; CROMWELL, Jeff B.; HANNAN, Michael H.; LABYS Walter 
C.; TERRAZA, Michel. Multivariate tests for time series models. California, Ansbury Park: Sage Publications, 1994; 
SEDDIGHI, H. R.; LAWLER K. A.; e KATOS, A. V. Econometrics: a practical approach. Nova York: Routledge, 2000. 
No nfvel intermediario, veja ENDERS, Walter. Applied econometric time series. Nova York: John Wiley & Sons, 
1995; PATTERSON, Kerry. An introduction to applied econometrics: a time series approach. Nova York: St. Martin's 
Press, 2000; MILLS, T. C. The econometric modelling of financial time series. 2. ed. Nova York: Cambridge Univer¬ 
sity Press, 1999; VERBEEK, Marno. A guide to modern econometrics. Nova York: John Wiley & Sons, 2000; e CHA- 
REMZA, Wojciech W.; DEADMAN, Derek F. New directions in econometric practice: general to specific modelling 
and vector autoregression. 2. ed. Nova York: Edward Elgar Publisher, 1997. No nfvel avanijado, veja HAMILTON, 
J. D. Time series analysis. Princeton, Nj: Princeton University Press, 1994; e MADDALA, G. S.; KIM, In-Moo. Unit 
roots, cointegration, and structural change. Cambridge University Press, 1998. No nfvel aplicado, veja RAO, B. Bhaskara 
(Ed.). Cointegration for the applied economist. Nova York: St. Martin's Press, 1994; e MUKHERJEE, Chandan; WHITE, 
Howard; WUYTS, Marc. Econometrics and data analysis for developing countries. Nova York: Routledge, 1998. 

2 E claro que temos os dados reais para esse perfodo agora e podemos compara-los com os dados "previstos" com 
base do perfodo anterior. 
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FIGURA 21.1 

Logaritmos de PIB, 
RPD e DCP reais, 
Estados Unidos, 
1947-2007 
(trimestralmente, 
em bilhoes de 
dolares). 

Notci: na figura, a letra L 
indica o logaritmo natural. 



FIGURA 21.2 

Logaritmos de lucros 
corporativos (LC) e 
dividendos, nos 
Estados Unidos, 
1947-2007 
(trimestralmente, em 
bilhoes de dolares) 
Nota: L indica logaritmo. 



21.2 Conceitos-chave * 1 2 3 4 5 6 7 8 9 


Qual e esse vocabulario? Ele se constitui em conceitos como os seguintes: 

1. Processos estocasticos 

2. Processos estacionarios 

3. Processos puramente aleatorios 

4. Processos nao estacionarios 

5. Variaveis integradas 

6. Modelos de passeios aleatorios 

7. Cointegra£ao 

8. Tendencias determim'sticas e estocasticas 

9. Testes de raiz unitaria 

A seguir, discutiremos cada um desses conceitos. Nossa discussao sera na maioria das vezes heu- 
rfstica. Onde for possrvel e util, forneceremos exemplos apropriados. 


3 A discussao a seguir e baseada em MADDALA et al., op. cit., CHAREMZA et al., op. cit. e ALEXANDER, Carol. 
Market models: a guide to financial data analysis. Nova York: John Wiley & Sons, 2001. 
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21.3 Processos estocasticos 


Um processo aleatorio ou estoc&stico e uma colegao de varidveis aleatorias ordenadas no tempo. 4 
Se deixarmos que Y denote uma variavel aleatoria, e se ela for contmua, nos a denotaremos como Y(t)\ 
mas, se for discreta, denotaremos como Y t . Um exemplo da primeira variavel e um eletrocardiograma, 
e um exemplo de ultima sao o PIB, a RPD etc. Uma vez que a maioria dos dados economicos sao co- 
letados em pontos discretos no tempo, para o nosso proposito utilizaremos a notagao Y, em vez de Y(t). 
Se permitirmos que Y represente o PIB, para os nossos dados temos Y h Y 2 , Y 2 ,...., Y 2 42 , Y 24i , Y 244 , em 
que o subscrito 1 denota a primeira observagao (isto e, o PIB do primeiro trimestre de 1947) e o subs- 
crito 244 denota a ultima observagao (isto e, o PIB do quarto trimestre de 2007). Tenha em vista que 
cada um desses Y e uma variavel aleatoria. 

Em que sentido podemos estimar o PIB como um processo estocastico? Considere, por exemplo, o 
PIB real de $3,759,997 bilhoes para 1970-1. Em teoria, o numero do PIB para o primeiro trimestre de 
1970 poderia ter sido qualquer um, dependendo do clima economico e politico que estivesse prevale- 
cendo. O numero de $3,759,997 e uma realizacao particular de todas essas possibilidades . 5 Sendo as- 
sim, podemos dizer que o PIB e um processo estocastico e os valores reais que observamos para o 
perfodo entre 1947-1 e 2007-IV sao realizagoes particulares desse processo (ou seja, uma amostra). A 
distingao entre o processo estocastico e sua realizagao e parecida com a distingao entre a populagao e 
a amostra de dados em cortes transversais. Do mesmo modo que utilizamos as amostras de dados para 
extrair inferences sobre a populagao, utilizamos, em series temporais, a realizagao para extrair inferen- 
cias sobre o processo estocastico subjacente. 

Processos estocasticos estacionarios 

Um tipo de processo estocastico que recebeu grande atengao e escrutfnio por parte dos analistas 
de series temporais e o assim chamado processo estocastico estacionario. Em linhas gerais, um 
processo estocastico sera chamado de estacionario se sua media e varidncia forem constantes ao 
longo do tempo e o valor da covariancia entre os dois periodos de tempo depender apenas da distan- 
cia, do intervalo ou da defasagem entre os dois periodos e nao o tempo real ao qual a covariancia e 
computada. Na literatura sobre as series temporais, tal processo estocastico e conhecido como pro¬ 
cesso estocastico fracamente estacionario, ou covariancia-estacionario, ou estacionario de se- 
gunda ordem, ou em sentido amplo. Para o proposito deste capltulo, e na maioria das situagoes 
praticas, esse tipo de estacionariedade em geral e suficiente . 6 

Para explicar a estacionariedade fraca, considere o Y, como uma serie temporal estocastica com 
essas propriedades: 


Media: E(Y t ) = p 

Varidncia: var(F r ) = E(Y t - p) 2 = er 2 


(21.3.1) 

(21.3.2) 

(21.3.3) 


Covarancia: 


Yk = E[(Y t - p){Y t+k - p)] 


em que a covariancia (ou autovariancia) na defasagem k, e a covariancia entre os valores de Y, 
e Yt+k’ isto e, entre dois valores de Y separados por k. Se k = 0, obtemos y 0 , que e simplesmente a 


4 0 termo "estocastico" vem da palavra grega stokhos, que significa um alvo ou centra do alvo. Se voce ja langou 
dardos em um alvo com o objetivo de atingi-lo, com que frequencia acertou esse alvo? Em cada cem dardos, 
voce pode ter a sorte de acertar o alvo apenas umas poucas vezes; outras vezes, os dardos se espalharao aleato- 
riamente ao redor do alvo. 

5 Voce pode pensar sobre o valor de US$3,759,997 bilhoes como a media de todos os possfveis valores do PIB para 
o primeiro trimestre de 1970. 

6 Uma serie temporal e estritamente estacionaria se todos os momentos de sua distribuigao de probabilidade, e 
nao apenas os dois primeiros (ou seja, a media e a variancia), sao invariantes ao longo do tempo. Contudo, se o 
processo estacionario for normal, o processo estocastico fracamente estacionario sera tambem estritamente es¬ 
tacionario, porque o processo estocastico normal e completamente especificado pelos seus dois momentos, a 
media e a variancia. 
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variancia de Y ( = er); se k — 1, y l e a covariancia entre os dois valores adjacentes de Y, o tipo de 
covariancia que encontramos no Capitulo 12 (lembre-se do esquema autoregressivo de primeira 
ordem markoviano). 

Suponha que mudemos a origem de Y de Y, para Y t+m (por exemplo, do primeiro trimestre de 1947 
ao primeiro trimestre de 1952 para os nossos dados do PIB). Agora, se Y, for estacionario, a media, a 
variancia e autocovariancias de Y t+m deverao ser iguais aquelas de Y,. Em resumo, se uma serie tem¬ 
poral for estacionaria, a media, variancia e autocovariancias (em variadas defasagens) permanece- 
rao as mesmas nao importa em que ponto a mensuremos; isto e, elas serao invariantes no tempo. Tal 
serie temporal tendera a retornar para a sua media (o que chamamos de reversao da media), e flutua- 
poes em torno dessa media (mensurada por sua variancia) terao, de modo geral, uma amplitude cons- 
tante. 7 Em outras palavras, um processo estacionario nao se desviara muito de seu valor medio em 
virtude da variancia finita. Como veremos em breve, esse nao e o caso do processo estocastico nao 
estacionario. Devemos observar que, para o processo estacionario, a velocidade da reversao a media 
depende das autocovariancias; isso sera rapido, se as autocovariancias forem pequenas, e lento quan- 
do sao grandes, como demonstraremos em seguida. 

Se uma serie temporal nao e estacionaria no sentido ha pouco definido, ela e chamada de serie tem¬ 
poral nao estacionaria (tenha em mente que estamos falando apenas sobre a estacionariedade fraca). 
Em outras palavras, uma serie temporal nao estacionaria tera uma media que varia com o tempo, ou 
uma variancia que varia com o tempo, ou, ainda, ambas. 

Por que as series temporais estacionarias sao tao importantes? Porque, se uma serie temporal e nao 
estacionaria, podemos estudar seu comportamento apenas pelo perfodo de tempo em considera£ao. 
Cada conjunto de dados de serie temporal, portanto, sera especifico a cada episodio. Como consequen- 
cia, nao e possfvel generaliza-lo para outros perfodos. Sendo assim, para o proposito de previsao, tal 
serie temporal (nao estacionaria) pode ser de pouco valor pratico. 

Como sabemos que uma serie temporal particular e estacionaria? Em particular, as series tempo¬ 
rais apresentadas nas Figuras 21.1 e 21.2 sao estacionarias? Abordaremos esse importante tema nas 
Se£oes 21.8 e 21.9, quando consideraremos varios testes de estacionariedade. Mas, se dependermos 
do senso comum, as series temporais retratadas nas Figuras 21.1 e 21.2 parecerao ser nao estaciona¬ 
rias, ao menos nos valores medios. Porem, falaremos sobre isso mais adiante. 

Antes de prosseguirmos, mencionaremos um tipo especial de processo estocastico (ou serie tempo¬ 
ral), ou seja, um processo puramente aleatorio ou de ruido branco. Chamamos um processo estocas¬ 
tico puramente aleatorio se ele tem media zero, variancia constante o 2 e e serialmente nao 
correlacionado. 8 9 Voce pode lembrar que o termo de erro u„ admitido no modelo classico de re- 
gressao linear normal que discutimos na Parte 1 deste livro, foi considerado um processo de ruido 
branco, que denotamos como u t ~ IIDN(0, a 2 ); isto e, u, e distribufdo independentemente e identica- 
mente como uma distribuiqao normal com media zero e variancia constante. Tal processso e chamado 
de processo de ruido branco gaussiano. 

Processos estocasticos nao estacionarios 

Embora nosso interesse esteja voltado para a serie temporal estacionaria, encontra-se frequente- 
mente a serie temporal nao estacionaria; o exemplo classico e o modelo de passeio aleatorio. 9 Em 
geral dizemos que os preqos dos ativos, como prepos das apoes ou taxas de cambio, seguem um pas¬ 
seio aleatorio; isto e, eles sao nao estacionarios. Distinguimos dois tipos de passeios aleatorios: (1) 


7 Isso foi apontado por CUTHBERTSON, Keith; HALL, Stephen G.; TAYLOR, Mark P. Applied econometric techniques. 
The University of Michigan Press, 1995. p. 1 30. 

8 Se e tambem independente, tal processo e chamado de estritamente de ruido branco. 

9 O termo passeio aleatorio e muitas vezes comparado com um caminhar de bebado. Deixando um bar, o bebado 
move-se numa distancia aleatoria u t no tempo t, e, continuando a caminhar indefinidamente, eventualmente se 
desviara cada vez mais do bar. O mesmo e dito sobre os pregos das agoes. O prego da agao de hoje e igual ao 
de ontem mais um choque aleatorio. 
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passeio aleatorio sem deslocamento (sem termo constante ou intercepto) e (2) passeio aleatorio com 
deslocamento (ou seja, um termo constante esta presente). 

Passeio aleatorio sem deslocamento 

Suponha que u, seja um termo de erro de ruido branco sem media 0 e variancia a 1 . Diz-se entao 
que a serie Y, e um passeio aleatorio se 

Y t =Y,-i+u t (21.3.4) 

No modelo de passeio aleatorio, como demonstra a Equagao (21.3.4) o valor de Y no tempo 1 e 
igual a seu valor no tempo (t — 1) mais um choque aleatorio; sendo assim, trata-se de um modelo 
AR(1), na linguagemdos Capftulo 12 e 17. Podemos pensar na Equa 9 ao (21.3.4) como uma regressao 
de Y no tempo t sobre seu valor defasado em um perfodo. Aqueles que acreditam na hipotese de 
eflciencia do mercado de capital argumentam que os preijos das a 9 oes sao essencialmente aleatorios 
e, por conseguinte, nao ha margem para especulacjao lucrativa no mercado de a 9 oes: se fosse possivel 
prever o pre 90 de amanha com base no pre 90 de hoje, todos serfamos milionarios. 

Agora, com base na Equa 9 ao (21.3.4), podemos escrever 
Yi = Yq + Ml 

Yl = Y\ + U2 = Yq + U\ + U2 
Yj = Y 2 + Ur, — Yq + U i + U2 “E U 3 

Em geral, se o processo iniciou-se em algum tempo 0 com o valor de Y 0 , temos 

Y t =Y 0 +J2 u t (21.3.5) 

Portanto, 

E(Y t ) = e(y 0 + = Yq (porque?) (21.3.6) 

Igualmente, pode ser demonstrado que 

var(y r ) = to 2 (21.3.7) 

Como a expressao anterior demonstra, a media de Y e igual ao seu valor inicial, ou de partida, que 
e constante, mas, como t aumenta, sua variancia aumenta indefinidamente, violando assim uma con- 
di 9 ao de estacionariedade. Em resumo, o modelo de passeio aleatorio sem deslocamento e um pro¬ 
cesso estocastico nao estacionario. Na pratica, Y 0 e frequentemente colocado em zero, caso em que 
E(Y t )= 0. 

Uma caracterfstica interessante do modelo de passeio aleatorio e a persistencia de choqnes alea¬ 
torios (erros aleatorios), que e claro por meio da Equa 9 ao (21.3.5): Y, e a soma do Y () inicial mais a 
soma dos choques aleatorios. Como resultado, o impacto de um choque particular nao se extingue. 
Por exemplo, se u 2 = 2 em vez de u 2 = 0, entao, todos os Y, a partir de Y 2 em diante serao 2 unidades 
maiores e o efeito desse choque nao desaparecera. E por isso que se diz que o passeio aleatorio tem 
memoria infinite. Como Kerry Paterson observa, o passeio aleatorio lembra-se para sempre do 
choque; 10 ele tem memoria infinita. A soma ]C u, tambem e conhecida como tendencia estocastica, 
sobre a qual ainda nos deteremos um pouco. 

Curiosamente, se escrevermos a Equa 9 ao (21.3.4) como 

(Y t - Y t -\) = AY t = u t (21.3.8) 

em que A e o primeiro operador de diferenpas abordado no Capitulo 12, toma-se facil mostrar que, 
enquanto Y, e nao estacionaria, sua primeira diferen 9 a e estacionaria. Em outras palavras, as primeiras 
diferen 9 as de series temporais de um passeio aleatorio sao estacionarias. Mas retomaremos esse tema 
mais adiante. 


10 


PATTERSON, Kerry, op cit., cap. 6. 
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Passeio aleatorio com deslocamento 

Vamos modificar a Equagao (21.3.4) como se segue: 

Y t =S+Y t -i+u t (21.3.9) 

em que S e conhecido como o parametro de deslocamento. O termo deslocamento vem do fato de 
que, se escrevemos a equagao anterior como 

Y t — Y t \ = AY t = 8 + u t (21.3.10) 

isso demonstra que Y, desloca-se para cima ou para baixo, dependendo de S ser positivo ou negativo. 
Note que o modelo (21.3.9) e tambem um modelo AR(1). 

Seguindo o procedimento discutido para o passeio aleatorio sem deslocamento, pode-se demons- 
trar que, para o modelo de passeio aleatorio com deslocamento (21.3.9), 

E(Y,)=Y 0 +t-S (21.3.11) 

var {Y,)=tcj 2 (21.3.12) 

Como se pode ver, para o modelo de passeio aleatorio com deslocamento, a media, bem como a 
variancia, aumenta ao longo do tempo, novamente violando as condigoes de estacionariedade (fraca). 
Em resumo, o modelo de passeio aleatorio, com ou sem deslocamento, e um processo estocastico nao 
estacionario. 

Para darmos uma ideia do passeio aleatorio com e sem deslocamento, conduzimos duas simula- 
goes como se segue: 

Y t =Y 0 +u, (21.3.13) 

em que u, sao termos de erro de ruido branco tais como u, ~ MO, 1); isto e, cada u, segue o padrao 
normal de distribuigao. De um gerador de numeros aleatorios, obtivemos 500 valores de u e geramos 
Y, como demonstrado naEquagao (21.3.13). Admitamos que Y 0 = 0. Entao, a Equagao (21.3.13) e um 
modelo de passeio aleatorio sem deslocamento. 

Agora considere 

Y t =S+Y 0 +u t (21.3.14) 

que e um modelo de passeio aleatorio com deslocamento. Admitimos u, e Y 0 como na Equagao 
(21.3.13) e admitimos que S = 2. 

Os graficos dos modelos (21.3.13) e (21.3.14), estao, respectivamente, nas Figuras 21.3 e 21.4. O 
leitor pode comparar esses dois diagramas a luz de nossa discussao sobre o modelo de passeio alea¬ 
torio com e sem deslocamento. 


FIGURA 21.3 

Um passeio 
aleatorio sem 
deslocamento. 
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FIGURA 21.4 

Urn passeio aleatorio 
com deslocamento. 



O modelo de passeio aleatorio e um exemplo do que e conhecido na literatura especifica como 
processo de raiz unitaria. Uma vez que esse termo j a se tornou corrente na literatura de series tem¬ 
porais, explicaremos a seguir o que e um processo de raiz unitaria. 


21.4 Processo estocastico de raiz unitaria 

Vamos escrever o modelo de passeio aleatorio (21.3.4) como: 

Y,= pY t - l +u t -\<p<\ (21.4.1) 

Esse modelo e semelhante ao modelo autorregressivo de primeira ordem de Markov que dis- 
cutimos no capftulo sobre autocorrela 9 ao. Se p = 1, a Equaijao (21.4.1) torna-se um modelo de 
passeio aleatorio (sem deslocamento). Se p e de fato 1, encontramos o que e conhecido como 
problema de raiz unitaria, isto e, uma situa§ao de nao estacionariedade; ja sabemos que, nesse 
caso, a variancia de Y t e nao estacionaria. O nome raiz unitaria deve-se ao fato de que p — l. 11 
Portanto, os termos nao estacionariedade, passeio aleatorio, raiz unitaria e tendencia estocasti- 
ca podem ser tratados como sindnimos. Se, entretanto, I/;I < 1, ou seja, se o valor absoluto de p for 
menor do que um, e possfvel demonstrar que a serie temporal Y, e estacionaria no sentido em que 
a definimos. 12 

Na pratica, por conseguinte, e importante descobrir se uma serie temporal possui uma raiz 
unitaria. 13 Na Se£ao 21.9, discutiremos varios testes de raiz unitaria, isto e, varios testes de esta¬ 
cionariedade. Nessa equagao, tambem determinaremos se as series temporais apresentadas nas 
Figuras 21.1 e 21.2 sao estacionarias. Talvez o leitor possa imaginar que elas nao sejam, mas de- 
vemos verificar. 


11 Uma questao tecnica: se p = 1, podemos escrever a Equagao (21.4.1) como Y t — Y t _i = u t . Agora, utilizando o 
operador de defasagem L de modo que LY t = Y, i, L 2 Y t - Y t 2, e assim por diante, podemos escrever a 
Equagao (21.4.1) como (1 — L) Y t = u t . O termo raiz unitaria refere-se a raiz do polinomio no operador de 
defasagem. Se estabelecermos que (1 — L) = 0, obteremos, L= 1, dal o nome raiz unitaria. 

12 Se na Equagao (21.4.1) considerarmos que o valor inicial de Y(= Y 0 ) e zero, |p| < 1, e u t e um rufdo branco e 
distribui-se normalmente com media zero variancia unitaria, segue-se que £(7,) = 0 e var (Vj) = 1/(1 — p 2 ). 
Uma vez que ambos sao constantes, pela definigao de estacionariedade fraca, Y t e estacionaria. Por outro lado, 
como vimos antes, se p = 1, Y t e um passeio aleatorio ou nao estacionario. 

13 Uma serie temporal pode conter mais do que uma raiz unitaria. Discutiremos essa situagao mais a frente neste 
capftulo. 
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21.5 Processos estocasticos de tendencia estacionaria (TE) e 
diferen<?a estacionaria (DE) 

A distingao entre processos estocasticos (ou series temporais) estacionarios e nao estacionarios 
possui um aspecto essencial relacionado ao fato de a tendencia (a lenta evolugao de longo prazo da 
serie temporal em consideragao), observada nas series temporais construfdas nas Figuras 21.3 e 21.4 
ou nas series temporais da economia real das Figuras 21.1 e 21.2, ser determinfstica ou estocastica. 
Em linhas gerais, se a tendencia em uma serie temporal e uma fungao determinfstica de tempo, como 
o tempo, tempo ao quadrado etc., ela e chamada de tendencia determinfstica; se nao e previsfvel, ela 
e chamada de tendencia estocastica. Para tornar a definigao mais formal, considere o seguinte mode- 
lo de serie temporal Y,\ 

Y t = P i + Pit + PiY t -1 + u t (21.5.1) 

em que u t e um termo de erro de rufdo branco efeo tempo mensurado cronologicamente. Agora, te- 
mos as seguintes possibilidades: 

Passeio aleatorio puro: se na Equagao (21.5.1) P\ = 0, P 2 = 0, yS 3 = 1, obtemos 

Y,= Y t ^ + u, (21.5.2) 

que nao e nada alem de um modelo de passeio aleatorio sem deslocamento e e, entao, nao estacionario. 
Mas observe que se escrevemos a Equagao (21.5.2) como 

A Y t = (Y,-Y,-i)= u t (21.3.8) 

ele se torna estacionario, como observamos anteriormente. Portanto, um modelo de passeio aleatorio 
sem deslocamento e um processo estacionario em diferenga (PED). 

Passeio aleatorio com deslocamento: se na Equagao (21.5.1) P\ ± 0, p 2 = 0, /J 3 = 1, 

Y t = P\ + Y,_ 1 + u,, (21.5.3) 

que e um passeio aleatorio com deslocamento e, portanto, nao estacionario. Se a escrevemos como 

(Y t - Y t - 1 ) = A Y, = Pi + u t (21.5.3o) 

isso significa que F,exibira uma tendencia positiva (p ] > 0) ou negativa (/J, < 0) (veja a Figura 21.4). 
Tal tendencia e chamada tendencia estocastica. A equagao (21.5.3a) e um processo PED, porque a 
nao estacionariedade de Y, pode ser eliminada ao tomar as primeiras diferengas da serie temporal. 
Lembre que u, na Equagao (21.5.3a) e um termo de erro de rufdo branco. 


FIGURA 21.5 

Tendencia 

determinfstica versus 
tendencia estocastica. 

Fonte: CHAREMZA et al., 
op. cit., p. 91. 
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Tendencia deterministica: se na Equa£ao (21.5.1), P\ / 0, p 2 / 0, /S 3 = 0, obtemos 

Y t =p l + p 2 t+u, (21.5.4) 

que e chamado de processo de tendencia estacionaria (PTE). Embora a media de Y t seja p x + p 2 t, 
nao seja constante, sua variancia (= cr) e. Uma vez que os valores de p t c p 2 sao conhecidos, a media 
pode ser perfeitamente prevista. Entao, se subtrairmos de Y, a media de Y t , a serie resultante sera esta¬ 
cionaria, dal o nome tendencia estacionaria. Esse procedimento de remover a tendencia (determim's- 
tica) e chamado remocao de tendencia. 

Passeio aleatorio com desiocamento e tendencia deterministica: se, na Equa£ao (21.5.1), P\ ± 0, 

P 2 j z 0, Pi= 1, obtemos 

Y t = P\ + Pit + Y t -1 + u t (21.5.5) 

em tal caso, temos um passeio aleatorio com desiocamento e uma tendencia deterministica, o que pode 
ser visto se escrevemos essa equa£ao como 

A Y t =p 1 +p 2 t+u, (21.5.5 a) 

que significa que Y,€ nao estacionaria. 

Tendencia deterministica com componente autorregressivo AR(1) estacionario: se em uma 

Equa£ao (21.5.1) P\ / 0, p 2 / 0, Pi < 1, entao obtemos 

Y t = Pi + Pit + PiYt-i + u t (21.5.6) 

que e estacionaria em torno de uma tendencia deterministica. 

Para verificar a diferen 9 a entre as tendencias estocasticas e deterministicas, considere a Figura 
21.5. 14 A serie chamada estocastica nessa figura e gerada por um modelo de passeio aleatorio com 
desiocamento: Y, = 0,5 + Y,_ x + li„ em que 500 valores de u, foram gerados de uma distribu^ao pa- 
drao normal e o valor inicial de Y foi estabelecido como 1. A serie chamada deterministica e gerada da 
seguinte maneira: Y, = 0,5 1 + u,, em que u, foi gerado como o acima e t refere-se ao tempo medido 
cronologicamente. 

Como se pode ver na Figura 21.5, no caso da tendencia deterministica, os desvios a partir da linha 
de tendencia (que representa a media nao estacionaria) sao puramente aleatorios e terminam rapida- 
mente; eles nao contribuem para o desenvolvimento a longo prazo da serie temporal, que e determi- 
nada pelo componente tendencial 0,5 1. No caso da tendencia estocastica, por outro lado, o 
componente aleatorio u, afeta o curso de longo prazo da serie Y t . 


21.6 Processos estocasticos integrados 

O modelo de passeio aleatorio nao passa de um caso especifico de mais uma classe geral de pro¬ 
cessos estocasticos conhecida como processos estocasticos. Lembre que o modelo de passeio alea¬ 
torio sem desiocamento e nao estacionario, mas sua primeira diferen 5 a, como demonstrado na 
Equa 5 ao (21.3.8), e estacionaria. Portanto, chamamos o modelo de passeio aleatorio sem desioca¬ 
mento integrado de ordem 1, denotado como 7(1). Da mesma forma, se uma serie temporal tem de 
ser duas vezes diferenciada (ou seja, chegar a primeira diferen 5 a das primeiras diferen 5 as) para 
torna-la estacionaria, chamamos tal serie temporal de integrada de ordem 2. 15 Em geral, se uma 
serie temporal (nao estacionaria) precisa ser diferenciada d vezes para tornar-se estacionaria, deno- 
minamos essa serie temporal integrada de ordem d. Uma serie temporal Y, integrada de ordem d 
denota-se como Y (l]j ~ Se uma serie temporal Y, e estacionaria desde o im'cio (ou seja, nao 


u A seguinte discussao e baseada em CHAREMZA, Wojciech W. et al., op. cit., p. 89-91. 

15 Por exemplo, se Y t e 1(2), entao AAf t = A (Y t - V' ( -i)= A Y t - Aft-i = ft- 2y t -j + ft -2 torna-se estacionaria. 
Mas observe que AAf t = A 2 f t # f ( -Y t - 2 - 
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requer qualquer diferencia£ao), dizemos que e integrada de ordem zero, denotada por Y, ~ 1(0). 
Utilizaremos os termos “serie temporal estacionaria” e “serie temporal integrada de ordem zero” 
para significar a mesma coisa. 

A maioria das series temporais economicas sao em geral 7(1); isto e, elas geralmente tornam-se 
estacionarias apenas depois de verificarmos suas primeiras diferen 5 as. As series temporais apresenta- 
das nas Figuras 21.1 e 21.2 sao 7 (1) ou de ordem mais elevada? Vamos examina-las nas Se£6es 21.8 
e 21.9. 

Propriedades das series integradas 

As seguintes propriedades das series temporais integradas podem ser observadas: vamos conside- 
rar A r , Y, e Z, como tres series temporais; entao: 

1. Se X, ~ 7 (0) e y f ~ 7(1), entao Z, = (X, + Y t ) = 7(1); isto e, uma combina 5 ao linear ou soma 
de serie temporal estacionaria e nao estacionaria e nao estacionaria. 

2. Se X, ~ 7 (d), entao Z,— (a + bX t ) — 1(d), em que a e b sao constantes. Ou seja, uma combina- 
£ao linear de uma serie 1(d) e tambem 1(d). Assim, se X, ~ 1(0), entao Z,= (a + bX,) ~ 7(0). 

3. Se X t ~ I (d\) e K, ~ 7 (af 2 X entao Z, = (aX,+ bY t ) ~ I (d 2 ), em que d\ < d 2 . 

4. Se X, ~ / (c7) e 7 (d), entao Z, = (aA, + 7>F,)~ I (d*)\ d* e geralmente igual a t/, mas, 
em alguns casos, d* < d (veja o topico sobre cointegraqao na Seqdo 21.11). 

Como se pode ver, deve-se prestar muita aten 5 ao na combina 5 ao de duas ou mais series temporais 
que sejam integradas de ordem diferente. 

Para entender por que isso e importante, considere o modelo de regressao de duas variaveis do 
Capitulo 3, ou seja, Y, = ( J >\ + fcX, + u,. Sob as premissas classicas dos MQO, sabemos que 

T x t y t 

( 21 . 6 . 1 ) 

em que as letras pequenas, como de costume, indicam desvio a partir dos valores medios. Suponha que 
Y, sej a 7(0), mas X, sej a 7( 1); isto e, a primeira e estacionaria e a ultima nao e. Uma vez que X, e nao 
estacionaria, sua variancia aumentara indefinidamente, dominando, portanto, o termo numerador na 
Equa 5 ao (21.6.1), resultando que fX convergira para zero assintoticamente (em amostras grandes) e 
nao tera nem mesmo uma distribu^ao assintotica. 16 


21.7 O fenomeno da regressao espuria 

Para verificar porque as series temporais estacionarias sao tao importantes, considere os proximos 
dois modelos de passeio aleatorio: 


Y,= Y t -i+u t (21.7.1) 

X, = X t . i + v t (21.7.2) 

em que geramos 500 observa 5 oes de u, a partir de u t ~ N( 0, 1) e 500 observa 5 oes de v, em v, ~ N( 0, 1) 
e presumimos que os valores iniciais tanto de Y quanto de X eram zero. Tambem presumimos que 
u, e v, sao serialmente nao correlacionados, bem como mutuamente nao correlacionados. Como 
agora voce ja sabe, ambas as series temporais sao nao estacionarias; isto e, elas sao 7(1) ou exibem 
tendencias estocasticas. 


16 


Esse ponto deve-se a MADDALA et al., op. cit., p. 26. 
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Suponha que fagamos a regressao de Y, em relagao a X,. Uma vez que Y, e X, sao processos nao 
correlacionados 7(1), o R 2 a partir da regressao de Y em X deveria tender a zero; isto e, nao deveria 
haver qualquer relagao entre as duas variaveis. Mas espere ate ver os resultados da regressao: 


Variable 

Coefficient 

Std. Error 

t Statistic 

C 

-13.2556 

0.6203 

-21.36856 

X 

0.3376 

0.0443 

7.61223 


R 2 = 0.1044 

d = 0.0121 



Como se pode ver, o coeficiente de X tem alta significancia estatistica e, embora o valor R 2 seja 
baixo, ele e de maneira estatistica significativamente diferente de zero. Com base nesses resultados, 
podemos ser tentados a concluir que ha uma relagao estatistica significativa entre Y e X, apesar de 
que, a priori, nao deveria haver nenhuma. Isso e, em resumo, o fenomeno de regressao espuria ou 
sem sentido, inicialmente descoberto por Yule. 17 Yule demonstrou que a correlagao (espuria) poderia 
persistir em uma serie temporal nao estacionaria mesmo se uma amostra fosse muito grande. O fato 
de haver algo de errado na regressao anterior e sugerido pelo valor d extremamente baixo de Durbin- 
-Watson, que sugere uma autocorrelagao de primeira ordem muito forte. De acordo com Granger e 
Newbold, uma R 2 > d e uma boa regra de bolso para suspeitar que a regressao estimada seja espii- 
ria, como no exemplo citado. Pode-se acrescentar que o R 2 e a estatistica t, assim como a regressao 
espuria, sao enganosos, e os t estatfsticos nao sao distribuidos como distribuigao t (de Student) e, 
entao, nao pode ser utilizado para testar hipoteses sobre os parametros. 

Que os resultados da regressao apresentados acima sejam insignificantes, isso pode ser facilmente 
verificado por meio da regressao das primeiras diferengas de Y, (= AY,) sobre as primeiras diferengas 
de X, ( = AY,); lembre que, embora Y, e X, sejam nao estacionarios, suas primeiras diferengas sao 
estacionarias. Nessa regressao, voce descobrira que R 2 e praticamente zero, como deveria ser, e a d 
Durbin-Watson e cerca de 2. No Exercicio 21.24, solicitaremos que voce estime essa regressao e 
verifique a afirmagao que acabamos de fazer. 

Embora exagerado, esse exemplo nos lembra que se deve ser extremamente cuidadoso ao condu- 
zir a analise da regressao baseada em uma serie temporal que exibe tendencias estocasticas. E deve- 
mos ser extremamente cautelosos ao ler os resultados da regressao baseados nas variaveis 7(1). Como 
exemplo, veja o Exercicio 21.26. De certo modo, isso vale para as series temporais sujeitas a tenden¬ 
cias determimsticas; um exemplo disso e dado no Exercicio 21.25. 


21.8 Testes de estacionariedade 

Neste ponto, o leitor provavelmente ja tem uma boa ideia acerca da natureza do processo estocas- 
tico estacionario e de sua importancia. Na pratica, enfrentamos duas questoes importantes: (1) como 
descobrir se uma dada serie temporal e estacionaria? (2) Se descobrimos que uma serie temporal e 
nao estacionaria, ha uma forma de podermos torna-la estacionaria? Adotaremos a primeira pergunta 
nesta segao e discutiremos a segunda pergunta na Segao 21.10. 

Antes de prosseguirmos, devemos ter em vista que estamos preocupados principalmente com a 
estacionariedade fraca ou covariancia-estacionariedade. Embora haja varios testes de estacionarieda¬ 
de, analisaremos apenas aqueles que sao destacadamente discutidos na literatura especifica. Nesta 
segao, discutiremos dois testes: (1) analise grafica e (2) o teste de correlograma. Em decorrencia da 
importancia atribuida ao teste de raiz unitaria no passado recente, ele sera discutido na proxima 
segao. Ilustraremos esses testes com exemplos apropriados. 


17 YULE, C. U. "Why do we sometimes get nonsense correlations between time series? A study in sampling and 
the nature of time series." Journal of the Royal Statistical Society, v. 89, p. 1 -64, 1926. Para simulagoes abrangentes 
de Monte Carlo sobre regressoes espurias veja GRANGER, C. W. J.; NEWBOLD, P. "Spurious regressions in 
econometrics." Journal of Econometrics, v. 2, p. 111 -120, 1974. 
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1. Analise grafica 

Como observado anteriormente, antes que se prossiga com os testes formais, e sempre prudente 
organizar a serie temporal sob estudo, como fizemos nas Figuras 21.1 e 21.2 para os dados da serie 
temporal da economia americana postada no site do livro. Os graficos dao uma pista inicial sobre a 
natureza provavel da serie temporal. Tome, por exemplo, a serie temporal do PIB demonstrada na 
Figura 21.1. Veremos que, ao longo do perfodo estudado, o logaritmo do PIB tem aumentado, isto e, 
demonstra uma tendencia ao aumento, o que sugere, talvez, que a media do PIB foi modificada. Isso 
talvez sugira que o log da serie do PIB seja nao estacionario. Isso e tambem mais ou menos verdadei- 
ro quanto a serie temporal da economia americana apresentada na Figura 21.2. Essa intuigao e o 
ponto de partida de mais testes formais de estacionariedade. 


2. Fun^ao de correla^ao (FAC) e correlograma 

Um teste simples de estacionariedade e baseado na assim chamada fun can de correla^ao (FAC). 
A FAC com defasagem k, denotada por p k , e definida como 



Yo 


covariancia com defasagem k 
variancia 


( 21 . 8 . 1 ) 


em que a covariancia com defasagem lea variancia sao aquelas anteriormente definidas. Observe 
que, se k — 0, p Q — 1 (por que?). 

Desde que tanto a covariancia como a variancia sao mensuradas nas mesmas unidades de medida, 
p k e um numero sem unidades ou puro. Ele se situa entre —1 e +1, como qualquer correlafao coefi- 
ciente faz. Se colocarmos p k contra k, o grafico que obteremos e conhecido como correlograma da 
popula^ao. 

Uma vez que, na pratica, apenas temos a realiza£ao (amostra) de um processo estocastico, pode- 
mos apenas computar a fun^ao de correla^ao amostral, p k . Para isso, precisamos primeiro calcular 
a covariancia da amostra com defasagem k, y k , e a variancia da amostra, y 0 , definidas como: 18 


Yk 


TXY t - Y)(Y t+k - Y) 


Yo = 


n 

W - Y) 2 
n 


em que neo tamanho da amostra efea media da amostra. 

Sendo assim, a fungao de correlayao amostral, com defasagem k e: 


( 21 . 8 . 2 ) 

(21.8.3) 



(21.8.4) 


que e simplesmente a razao da covariancia da amostra (com defasagem l)ca variancia da amostra. O 
grafico de p k contra k 6 conhecido como correlograma amostral. 

Como um correlograma amostral permite descobrir se uma serie temporal particular e estacionaria? 
Para esse proposito, permita-nos primeiro apresentar os correlogramas amostrais do processo aleatorio 
puramente de rufdo branco e de um processo de passeio aleatorio. Voltemos ao modelo de passeio 
aleatorio sem deslocamento (21.3.13). La, geramos uma amostra de 500 termos de cito, os u, da dis- 
tribui 5 ao normal padrao. O correlograma desses 500 termos de erro puramente aleatorio estao na 
Figura 21.6; apresentamos esse correlograma com ate 30 defasagens. Comentaremos brevemente o 
processo de escolher a extensao da defasagem. 


18 A rigor, deveremos dividir a covariancia da amostra com defasagem k por (n — k) e a variancia amostral por 
(n — 1) em vez de por n (por que?), em que n e o tamanho da amostra. 
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FIGURA 21.6 

Correlograma de 
termo de erro u ou de 
rufdo branco. 


Amostra: 2 500 
Observagoes inclufdas: 499 


Autocorrelagao 

Correlagao parcial 


AC 

PAC 

Estat Q 

Prob 

1 

1 

1 

i 

i 

-0,022 

-0,022 

0,2335 

0,629 

I 

I 

I 

i 

2 

-0,019 

-0,020 

0,4247 

0,809 

1 

1 

1 

i 

3 

-0,009 

-0,010 

0,4640 

0,927 

l| 

1 

11 

i 

4 

-0,031 

-0,031 

0,9372 

0,919 

1 

I 

1 

i 

5 

-0,070 

-0,072 

3,4186 

0,636 

1 

1 

1 

i 

6 

-0,008 

-0,013 

3,4493 

0,751 

1 

H 

1 

n 

7 

0,048 

0,045 

4,6411 

0,704 

1 

1 

1 

i 

8 

-0,069 

-0,070 

7,0385 

0,532 

1 

1 

1 

i 

9 

0,022 

0,017 

7,2956 

0,606 

1 

1 

1 

i 

10 

-0,004 

-0,011 

7,3059 

0,696 

1 

| 1 

1 

i 

11 

0,024 

0,025 

7,6102 

0,748 

1 

1 

1 

i 

12 

0,024 

0,027 

7,8993 

0,793 

1 

; i 

1 

i 

13 

0,026 

0,021 

8,2502 

0,827 

i 

i 

HI 

i 

14 

-0,047 

-0,046 

9,3726 

0,806 

i 

i 

II 

i 

15 

-0,037 

-0,030 

10,074 

0,815 

l| 

i 

l| 

i 

16 

-0,026 

-0,031 

10,429 

0,843 

l| 

i 

l| 

i 

17 

-0,029 

-0,024 

10,865 

0,863 

i 

i 

H 

i 

18 

-0,043 

-0,050 

11,807 

0,857 

1 

n 

1 

i 

19 

0,038 

0,028 

12,575 

0,860 

1 

■ 

1 

■ 

20 

0,099 

0,093 

17,739 

0,605 

1 


1 

i 

21 

0,001 

0,007 

17,739 

0,665 

1 

■ 

1 

i 

22 

0,065 

0,060 

19,923 

0,588 

1 

n 

1 

n 

23 

0,053 

0,055 

21,404 

0,556 

1 

i 

1 

i 

24 

-0,017 

-0,004 

21,553 

0,606 

1 

i 

1 

i 

25 

-0,024 

-0,005 

21,850 

0,644 

1 

i 

1 

i 

26 

-0,008 

-0,008 

21,885 

0,695 

l| 

i 

i ; 

i 

27 

-0,036 

-0,027 

22,587 

0,707 

i 

V 

i 

■ 

28 

0,053 

0,072 

24,068 

0,678 

1 

1 

i 

i 

29 

-0,004 

-0,011 

24,077 

0,725 

1 

1 

H 

i 

30 

-0,026 

-0,025 

24,445 

0,752 


AC = autocorrela^ao, PAC = autocorrela 9 ao parcial (veja o Capftulo 22), Estat Q = estatfstica Q, Prob = probabilidade. 


Por enquanto, apenas observe a coluna inclmda como AC, que e a fungao de correlagao amostral, 
e o primeiro diagrama a esquerda, classificado como Autocorrelagao. A linha vertical solida nesse 
diagrama representa o eixo zero; as observances a direita da linha sao valores positivos e aquelas a 
esquerda da linha sao valores negativos. Como fica muito claro por meio desse diagrama, para um 
processo de rufdo puramente branco a autocorrelagao gira em torno de zero em varias defasagens. 
Essa e a imagem de um correlograma de uma serie temporal estacionaria. Sendo assim, se o corre¬ 
lograma de uma serie temporal (economica) real assemelha-se ao correlograma de uma serie tempo¬ 
ral de rufdo branco, podemos dizer que a serie temporal e provavelmente estacionaria. 

Agora, observe o correlograma de uma serie de passeio aleatorio, como gerada, por exemplo, 
pela Equagao (21.3.13). A imagem e semelhante a da Figura 21.7. A caracterfstica que mais se 
destaca nesse correlograma e que os coehcientes de autocorrelagao nas diversas defasagens sao 
realmente muito altos, chegando ate mesmo a uma defasagem acima de 33 trimestres. Na verdade, 
se considerarmos defasagens acima de 60 trimestres, os coehcientes de autocorrelagao serao mui¬ 
to altos; o coehciente e cerca de 0,7 na defasagem de 60 trimestres. A Figura 21.7 apresenta o 
correlograma caracteristico de uma serie temporal nao estacionaria: o coehciente de autocorrela¬ 
gao comega com um valor alto e diminui muito lentamente em diregao a zero a medida que a de¬ 
fasagem aumenta. 
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FIGURA 21.7 

Correlograma de uma 
serie temporal de 
passeio aleatorio. 

Veja a Figura 21.6 
para as definigoes. 


Amostra: 2 500 


Observances inclufdas: 499 


Autocorrelagao 



Correlagao parcial 


AC 

PAC 

Estat Q 

Prob 

1 


1 

0,992 

0,992 

493,86 

0,000 

1 

1 

2 

0,984 

0,000 

980,68 

0,000 

1 

|l 

3 

0,976 

0,030 

1461,1 

0,000 

1 

1 

4 

0,969 

0,005 

1935,1 

0,000 

1 

1 

5 

0,961 

-0,059 

2402,0 

0,000 

1 

H 

6 

0,953 

0,050 

2862,7 

0,000 

1 

1 

7 

0,946 

0,004 

3317,3 

0,000 

1 

|l 

8 

0,939 

0,040 

3766,4 

0,000 

1 

1 

9 

0,932 

-0,009 

4210,1 

0,000 

1 

H 

10 

0,927 

0,055 

4649,1 

0,000 

1 

1 

11 

0,921 

0,018 

5083,9 

0,000 

1 

|l 

12 

0,916 

0,039 

5514,9 

0,000 

1 

1 

13 

0,912 

0,002 

5942,4 

0,000 

1 

H 

14 

0,908 

0,056 

6367,0 

0,000 

1 

1 

15 

0,905 

0,061 

6789,8 

0,000 

1 

1 

16 

0,902 

0,000 

7210,6 

0,000 

1 

1 

17 

0,899 

0,006 

7629,4 

0,000 

1 

|l 

18 

0,896 

0,030 

8046,7 

0,000 

i 

i 

19 

0,894 

0,053 

8463,1 

0,000 

1 

1 

20 

0,892 

0,013 

8878,7 

0,000 

1 

1 

21 

0,890 

-0,041 

9292,6 

0,000 

I 

i 

22 

0,886 

-0,040 

9704,1 

0,000 

i 

i 

23 

0,882 

-0,044 

10113, 

0,000 

1 

1 

24 

0,878 

-0,012 

10518, 

0,000 

1 

1 

25 

0,873 

-0,023 

10920, 

0,000 

I 

i 

26 

0,867 

-0,041 

11317, 

0,000 

H 

i 

27 

0,860 

-0,055 

11709, 

0,000 

H 

i 

28 

0,853 

-0,045 

12095, 

0,000 

1 

1 

29 

0,846 

-0,010 

12476, 

0,000 

1 

1 

30 

0,839 

0,008 

12851, 

0,000 

1 

1 

31 

0,832 

-0,006 

13221, 

0,000 

1 

1 

32 

0,825 

0,003 

13586, 

0,000 

1 

1 

33 

0,819 

-0,006 

13946, 

0,000 


Agora, vejamos um exemplo concreto. Examinemos o correlograma da serie temporal do 
LPIB esbogado com os dados da serie temporal da economia norte-americana postados no site do 
livro (veja a Segao 21.1). O correlograma com defasagens acima de 36 e demonstrado na Figura 
21.8. O correlograma do LPIB com mais de 36 defasagens tambem mostra um padrao semelhan- 
te ao modelo de correlograma de passeio aleatorio da Figura 21.7. O coeficiente de autocorrela¬ 
gao comega com um valor muito alto na defasagem 1 (0,977) e diminui muito lentamente. Desse 
modo, parece que a serie temporal do LPIB e nao estacionaria. Se voce esbogar os correlogramas 
de outras series temporais da economia norte-americana apresentadas nas Figuras 21.1 e 21.2, 
vera tambem um padrao similar, o que leva a conclusao de que todas as series temporais sao nao 
estacionarias; elas podem ser nao estacionarias na media, na variancia ou em ambas. 

Duas questoes praticas podem ser colocadas aqui. Primeiro, como escolhemos o tamanho da 
defasagem para computar a fungao de autocorrelagao? Segundo, como decidir se um coeficiente 
de correlagao em uma certa defasagem e estatisticamente significativo? A resposta e apresentada 
a seguir: 
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FIGURA 21.8 

Correlograma do 
LPIB norte- 
-americano, entre 
1947-1 e 2007-IV. 
Veja a Figura 21.6 
para as definigoes. 


Amostra: 1947-1 2007-IV 
Observagoes inclufdas: 244 

Autocorrelagao Correlagao parcial 




AC 

PAC 

Estat Q 

Prob 

1 

0,977 

0,977 

235,73 

0,000 

2 

0,954 

-0,009 

461,43 

0,000 

3 

0,931 

-0,010 

677,31 

0,000 

4 

0,908 

-0,006 

883,67 

0,000 

5 

0,886 

-0,003 

1080,9 

0,000 

6 

0,864 

-0,001 

1269,3 

0,000 

7 

0,843 

-0,006 

1449,3 

0,000 

8 

0,822 

-0,006 

1621,0 

0,000 

9 

0,801 

-0,010 

1784,6 

0,000 

10 

0,780 

-0,004 

1940,6 

0,000 

11 

0,759 

-0,007 

2089,0 

0,000 

12 

0,738 

-0,013 

2230,0 

0,000 

13 

0,718 

0,003 

2364,1 

0,000 

14 

0,699 

-0,005 

2491,5 

0,000 

15 

0,679 

-0,001 

2612,4 

0,000 

16 

0,660 

-0,004 

2727,2 

0,000 

17 

0,642 

-0,002 

2836,2 

0,000 

18 

0,624 

0,002 

2939,6 

0,000 

19 

0,607 

0,003 

3037,8 

0,000 

20 

0,590 

-0,003 

3130,9 

0,000 

21 

0,573 

-0,003 

3219,3 

0,000 

22 

0,557 

-0,003 

3303,1 

0,000 

23 

0,541 

-0,001 

3382,5 

0,000 

24 

0,526 

0,007 

3457,9 

0,000 

25 

0,511 

0,002 

3529,4 

0,000 

26 

0,496 

-0,005 

3597,2 

0,000 

27 

0,482 

-0,011 

3661,4 

0,000 

28 

0,467 

-0,009 

3722,0 

0,000 

29 

0,453 

-0,005 

3779,2 

0,000 

30 

0,438 

-0,006 

3833,1 

0,000 

31 

0,424 

-0,005 

3883,9 

0,000 

32 

0,411 

0,004 

3931,6 

0,000 

33 

0,398 

0,004 

3976,7 

0,000 

34 

0,385 

-0,001 

4019,1 

0,000 

35 

0,373 

-0,009 

4058,9 

0,000 

36 

0,360 

-0,010 

4096,3 

0,000 


A escolha da extensdo da defasagem 

Essa e basicamente uma questao empirica. Uma regra de bolso e computar a fungao de correlagao 
de um tergo ate um quarto da extensao da serie temporal. Uma vez que, para os nossos dados econo- 
micos, temos 244 observagoes trimestrais, por essa regra as defasagens de 61 a 81 trimestres sao sufi- 
cientes. Para economizar espago, exibimos apenas 36 defasagens no grafico da fungao de autocor- 
relagao na Figura 21.8. A melhor recomendagao e comegar com defasagens suficientemente grandes e 
entao reduzi-las por algum criterio estatfstico, como o Akaike ou o criterio de infonnagao Schwarz, 
discutidos no Capltulo 13. Por outro lado, podem-se utilizar os seguintes testes estatfsticos. 

Significado estatfstico dos coeficientes de correlagao 

Considere, por exemplo, o correlograma da serie temporal do LPIB dada na Figura 21.8. Como 
decidimos se o coeficiente de correlagao de 0,780 na defasagem 10 (trimestres) e estatisticamente 
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significative)? A significance estatistica de qualquer p k pode ser julgada por seu erro padrao. Bartlett 
demonstrou que, se uma serie temporal e puramente aleatoria, isto e, ela exibe ruldo branco (veja 
a Figura 21.6), os coeficientes de correlapao amostral, p k sao aproximadamente 19 

Pk~ N(0, \/n) (21.8.5) 

isto e, em amostras grandes, os coeficientes de correlaqao amostral sao nonnalmente distribuidos com 
a media zero e a variancia igual a 1 sobre o tamanho da amostra. Uma vez que temos 244 observapoes, 
a variancia e 1/244 ~ 0,0041 e o erro padrao e VO.0041 = 0,0640. Seguindo as propriedades da dis- 
tribuipao padrao normal, o intervalo de confianpa de 95% para qualquer (populapao) p k e: 

p k ± 1,96(0,0640) = p k ± 0,1254 (21.8.6) 

Em outras palavras, 

Prob (p k - 0,1254 < p k < p k + 0,1254) = 0,95 (21.8.7) 

Se o intervalo anterior inclui o valor zero, nao rejeitamos a hipotese de que o verdadeiro p k seja 
zero, mas, se esse intervalo nao inclui 0, rejeitamos a hipotese de que o verdadeiro p k seja zero. 
Aplicando isso ao valor estimado de p 10 = 0,873, o leitor pode verificar que o intervalo de confianpa 
de 95% para o verdadeiro p 10 e (0,873 ± 0,1254) ou (0,7476, 0,9984). 20 Obviamente, esse intervalo 
nao inclui o valor de zero, sugerindo que somos 95% confiantes de que o verdadeiro p 10 e significante- 
mente diferente de zero. 21 Como se pode verificar, mesmo com a defasagem 20, P 20 estimado e estatis- 
ticamente significante no nivel de 5%. 

Em vez de testar a significancia da estatistica de qualquer coeficiente de correlapao, podemos 
testar a hipotese conjunta de que todos os p k ate determinadas defasagens sao simultaneamente iguais 

a zero. Isso pode ser feito por meio da estatistica Q desenvolvida por Box e Pierce, definida 

22 

como: 


Q 


m 




( 21 . 8 . 8 ) 


em que n — tamanho da amostra e m — tamanho da defasagem. A estatistica Q e frequentemente uti- 
lizada como um teste para verificar se uma serie temporal e um ruido branco. Em amostras grandes, e 
aproximadamente distribulda como a distribuipao qui-quadrado com m graus de liberdade. Em uma 
aplicapao, se o Q computado excede o valor crltico Q a partir da distribu^ao de qui-quadrado no 
nivel escolhido de significancia, pode-se rejeitar a hipotese nula de que todos os p k (verdadeiros) sao 
zero; no mlnimo alguns deles devem ser nao zero. 

Uma variante da estatistica Q, de Box-Pierce, e a estatistica Ljung-Box (LB), definida como: 23 


LB = 


n{n + 2 )^ 


k= 1 


JL 

n - k 


X 2 m 


(21.8.9) 


19 BARTLETT, M. S. "On the theoretical specification of sampling properties of autocorrelated time series." journal 
of the Royal Statistical Society, Serie B, 1946. v. 27, p. 27-41. 

20 O tamanho de nossa amostra de 244 observapoes e razoavelmente grande para usar a aproximapao normal. 

21 Por outro lado, se voce dividir o valor estimado de qualquer p k pelo erro padrao de (i/TTn), para um n suficien- 
temente grande, voce obtera o valor padrao o Z, cuja probabilidade pode ser facilmente obtida com base na 
tabela padrao normal. Entao, para o p 10 = 0,780 estimado, o valor de Z e 0,780/0,1066 = 7,32 (aprox.). Se o 
verdadeiro pi 0 fosse de fato zero, a probabilidade de obter um valor Z igual a 7,32 ou maior seria muito peque- 
na, portanto, rejeita-se a hipotese de que o verdadeiro p 10 seja zero. 

22 BOX, C. E. P.; PIERCE, D. A. "Distribution of residual autocorrelations in autoregressive integrated moving average 
time series models." journal of the American Statistical Association, 1970. v. 65, p.1.1509-1526. 

23 LJUNG, G. M.; BOX, G. E. P. "On a measure of lack of fit in time series models." Biometrika, 1978. v. 66, p. 66-72. 
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Embora, nas amostras grandes, tanto a estatfstica Q quanto a LB seguem a distribuigao de qui- 
-quadrado com m graus de liberdade, a estatfstica LB descobriu ter melhores (mais poderosos, no 
sentido estatfstico) propriedades de amostras pequenas do que a estatfstica Q. 24 

Voltando ao exemplo LPIB dado na Figura 21.8, o valor da estatfstica Q ate a defasagem 36 e 
cerca de 4096. A probabilidade de obter tal valor Q sob a hipotese nula de que a soma dos quadrados 
de 36 coeficientes de correlagao estimados e zero e praticamente zero, como mostra a liltima coluna 
daquelas figuras. Portanto, a conclusao e de que a serie temporal LPIB e provavelmente nao estacio- 
naria, ou seja, reforga nosso palpite, com base na Figura 21.1, de que a serie LPIB pode ser nao esta- 
cionaria. No Exercicio 21.16, pedimos que voce confirme que as outras quatro series temporais da 
economia norte-americana tambem sao nao estacionarias. 


21.9 O teste da raiz unitaria 


Um teste de estacionariedade (ou nao estacionariedade) que se tomou amplamente popular nos 
ultimos anos e o teste de raiz unitaria. Primeiro, vamos explica-lo, ilustra-lo e, depois, considerar 
algumas de suas limitagoes. 

O ponto de partida e o processo de raiz unitaria (estocastico) que discutimos na Segao 21.4. Co- 
megamos com 

Y t =pY t -i + u, - 1 < p < 1 (21.4.1) 


em que u,e um termo de erro de rufdo branco. 

Sabemos que, se p — 1, isto e, no caso da raiz unitaria, a Equagao (21.4.1) torna-se um modelo de 
passeio aleatorio sem deslocamento, que sabemos ser um processo estocastico nao estacionario. Sendo 
assim, por que nao fazer apenas a regressao de Y, sobre seu valor defasado (de um perfodo), 7 f _ h e 
verificarmos se o p estimado e estatisticamente igual a 1 ? Se for isso, entao 7, sera nao estacionario. 
Essa e a ideia geral que esta por tras do teste de estacionariedade de raiz unitaria. 

Entretanto, nao podemos estimar a Equagao (21.4.1) pelos MQO e testar a hipotese de que p — 1 
pelo teste habitual, t porque esse teste e rigorosamente viesado no caso de uma raiz unitaria. Desse 
modo, manipulamos a Equagao (21.4.1) como se segue: subtraia Y,_ x de ambos os lados da Equagao 

(21.4.1) para obter 


Y t - 7,-i = pY t - X - Y t -i + u t 
= (P ~ 1)7,-1 + ut 


(21.9.1) 


que pode tambem ser escrita como 

A 7, = <57,_ i + u t 


(21.9.2) 


em que S — (p — l)e A, como sempre, e o primeiro operador da diferenga. 

Na pratica, por conseguinte, em vez de estimarmos a Equagao (21.4.1), estimamos a Equagao 

(21.9.2) e testamos a hipotese (nula) de que S — 0, sendo a hipotese alternativa 8 < 0 (veja a nota de 
rodape 25). Se 8 — 0, entao p — 1, isto e, temos uma raiz unitaria, o que significa que a serie temporal 
sob consideragao e nao estacionaria. 

Antes que prossigamos estimando a Equagao (21.9.2), podemos observar que, se 8 = 0, a Equagao 

(21.9.2) se tornara 


A7, = (7, - 7,_i)= u t (21.9.3) 

Uma vez que u, e um tenno de erro de ruido branco, ele e estacionario, o que significa que as 
primeiras diferengas de uma serie temporal de passeio aleatorio sao estacionarias, um ponto que ja 
estabelecemos. 


24 As estatfsticas Q e LB podem nao ser apropriadas em todos os casos. Para uma posigao crftica, veja MADDALA 
et al., op. cit., p. 19. 
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Agora, vamos voltar a estimagao da Equagao (21.9.2). Isso e bastante simples; tudo o que temos 
a fazer e tomar as primeiras diferengas de Y t , fazer a regressao dessas em Y ,_, e ver se o coeficiente 
angular estimado (= 5) e zero ou nao. Se e zero, conclulmos que V, e nao estacionaria; mas, se e ne- 
gativo, conclulmos que Y, e estacionaria. 25 A unica questao e qual teste utilizar para descobrir se o 
coeficiente estimado de Y,_ 1 na Equagao (21.9.2) e zero ou nao. Voce pode estar tentado a dizer: por 
que nao utilizar o costumeiro teste ft Infelizmente, sob a hipotese nula de que 5 = 0 (ou seja, p = 1), 
o valor t do coeficiente estimado de Y,_ x nao segue a distribuigao t, mesmo em grandes amostras; ou 
seja, nao possui uma distribuigao assintotica normal. 

Qual e a alternativa? Dickey e Fuller demonstraram que, sob a hipotese nula de que 8 = 0, o valor 
estimado 1 do coeficiente de Y ,_, na Equagao (21.9.2) segue a cstatlstica r (tau). 26 Esses autores 
computaram os valores fundamentals da estatistica r segundo as simulagoes de Monte Carlo. Uma 
amostra desses valores fundamentals e dada no Apendice D, Tabela D.7. A tabela e limitada, mas 
MacKinnon preparou tabelas mais extensas, que sao agora incorporadas em diversos pacotes econo- 
metricos. 27 Na literatura especifica, a estatistica ou teste de tau e conhecida como teste Dickey- 
-Fuller (DF), em homenagem aos seus descobridores. Curiosamente, se a hipotese de que 5 = 0 for 
rejeitada (a serie temporal e estacionaria), poderemos utilizar o costumeiro teste t (Student). Tenha 
em vista que o teste Dickey-Fuller e unilateral, porque a hipotese alternativa e que 5 < 0 (ou p < 1). 

O procedimento real para a implementagao do teste DF envolve varias decisoes. Ao discutirmos a 
natureza do processo de raiz unitaria nas Segoes 21.4 e 21.5, observamos que umprocesso de passeio 
aleatorio pode ou nao ter deslocamento, ou ele pode ter tanto tendencias determinlsticas quanto esto- 
casticas. Para permitir as varias possibilidades, o teste DF e estimado de tres formas diferentes, isto 
e, sob tres diferentes hipoteses nulas: 


Y, e um passeio aleatorio: 

A Y t — 8Y t —\ + Uj 

(21.9.2) 

Y, e um passeio aleatorio com deslocamento: 

A Y t = fi\ + 51)_i + u t 

(21.9.4) 

Y, e um passeio aleatorio com deslocamento 
em torno de uma tendencia determinlstica: 

AU = + ^ 2 l + 8Y t -\ + u i 

(21.9.5) 


em que tea variavel de tendencia ou temporal. Em cada caso, as hipoteses sao: 

Hipotese nula : H 0 : 5 = 0 (ha uma raiz unitaria ou a serie temporal e nao estacionaria, ou ela pos¬ 
sui uma tendencia estocastica). 

Hipotese alternativa'. Hp 5 < 0 (a serie temporal e estacionaria, possivelmente em torno de uma 
tendencia determinlstica). 28 

Se a hipotese nula for rejeitada, significa que (1) Y, e estacionaria com media zero, no caso da 
Equa 5 ao (21.9.2), ou (2) Y, e estacionaria com media nao zero, no caso da Equa 5 ao (21.9.4). No caso 
da Equa 5 ao (21.9.5), podemos testar 5 < 0 (nenhuma tendencia estocastica) e a ± 0 (a existencia de 
uma tendencia determinlstica) simultaneamente, utilizando o teste F, mas utilizando os valores fun¬ 
damentals tabulados por Dickey e Fuller. Nota-se que uma serie temporal pode conter tanto a tenden¬ 
cia estocastica quanto a determinlstica. 

E extremamente importante observar que os valores fundamentals do teste tau para verificar a hipo¬ 
tese de que 5 = 0 sao diferentes para cada uma das tres especiftcaqoes anteriores do teste DF, o que pode 


25 Uma vez que S = (p — 1), para que se tenha a estacionariedade, p deve ser menor do que um. Para isso acontecer 
<5 deve ser negativo. 

26 DICKEY, D. A.; FULLER, W. A. "Distribution of the estimators for autoregressive time series with a unit root." 
lournal of the American Statistical Association, v. 74, p. 427-431, 1979. Veja tambem FULLER, W. A. Introduction 
to statistical time series. Nova York: John Wiley & Sons, 1976. 

27 MACKINNON, J. G. "Critical values of cointegration tests." In: ENGLE, R. E.; GRANGER, C. W. J. (Eds.). Long-run 
economic relationships: readings in cointegration. Nova York: Oxford University Press, 1991. cap. 13. 

28 Rejeitamos qualquer possibilidade de que S > 0, porque, nesse caso p > 1, em que a serie temporal sera explosiva. 
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ser visto claramente no Apendice D, Tabela D.7 Alem disso, se, por exemplo, a especificapao (21.9.4) 
estiver correta, mas fizermos a estimapao da Equapao (21.9.2), estaremos cometendo um erro de especi- 
ficapao, cujas consequencias ja conhecemos no Capltulo 13. O mesmo e verdadeiro se estimarmos a 
Equapao (21.9.4) em vez da verdadeira Equapao (21.9.5). De fato, nao ha forma de saber com qual espe- 
cificapao comepar. Algumas tentativas e erros sao inevitaveis, nao obstante a garimpagem de dados. 

O procedimento de estimapao real e o seguinte: estime a Equapao (21.9.2) ou a Equapao (21.9.3) 
ou a Equapao (21.9.4) pelos MQO; divida o coeficiente estimado de Y ,_, em cada caso pelo seu erro 
padrao para computar a estatfstica tau (r); e consulte as tabelas Dickey-Fuller (ou qualquer pacote 
estatfstico). Se o valor absoluto computado da estatfstica tau (Irl) exceder o valor crftico nas estatfs- 
ticas tau Dickey-Fuller e MacKinnon, rejeitaremos a hipotese de que S = 0, e, nesse caso, a serie 
temporal sera nao estacionaria. Por outro lado, se o valor absoluto calculado Irl nao exceder o valor 
crftico de tau , nao rejeitaremos a hipotese nula, o que quer dizer que a serie temporal sera nao estacio¬ 
naria. Assegure-se de que sejam usados os valores apropriados de r. Na maioria das aplicapoes, o valor 
de tau sera negativo. Portanto, podemos dizer que, se o valor crftico (negativo) de tau computado for 
menor do que (mais negativo do que) o valor crftico de tau, rejeitaremos a hipotese nula (a serie tem¬ 
poral sera estacionaria), caso contrario, nao a rejeitaremos (a serie temporal sera nao estacionaria). 

Vamos voltar a serie temporal do PIB americano. Para essa serie, os resultados das tres re- 
gressoes (21.9.2), (21.9.4) e (21.9.5) sao como se segue: a variavel dependente em cada caso e 
AY, = A LPlB t , em que LPIB e o logaritmo do PIB real. 


aTpIB t = 0,000968LPIB,_1 

t= (12,9270) i? 2 = 0,0147 d= 1,3194 

aTpIb, = 0,0221 - 0,00165LPIB,_! 

t= (2,4342) (-1,5294) R 2 = 0,0096 d= 1,3484 

aTpIb, = 0,2092 + 0,0002f- 0,0269LPIB f _ x 

t= (1,8991) (1,7040) (- 1,8102) 

= 0,0215 d= 1,3308 


(21.9.6) 

(21.9.7) 


(21.9.8) 


Nosso interesse principal em todas essas regressoes esta no valor t (— r) do coeficiente LPIB, ,. 
Se voce observar a Tabela D.7, do Apendice D, vera que os valores crfticos de r de 5% para uma 
amostra do tamanho 250 (o numero mais proximo a nossa amostra de 244 observapoes) sao —1,95 
(sem intercepto, sem tendencia), —2,88 (com intercepto, mas sem tendencia) e —3,43 (com intercepto 
e com tendencia). O EViews e outros pacotes estatfsticos fomecem valores fundamentais para o ta¬ 
manho da amostra utilizado na analise. 

Antes de examinarmos os resultados, devemos decidir qual dos tres modelos podem ser apropria¬ 
dos. Devemos rejeitar o modelo (21.9.6), porque o coeficiente de LPIB,_], que e igual a 8,6 positivo. 
Mas, uma vez que 8 — ( p — 1), um d positivo implicaria que p > 1. Embora seja possfvel na teoria, 
rejeitamos isso porque, neste caso, a serie temporal LPIB seria explosiva. 29 Sendo assim, restam-nos 
os modelos (21.9.7) e (21.9.8). Em ambos os casos, o coeficiente estimado d e negativo, implicando 
que o p estimado e menor do que 1. Para esses dois modelos, os valores estimados p sao 0,9984 e 
0,9731, respectivamente. A unica pergunta agora e se ha valores estatisticamente significativos abai- 
xo de 1 para que declaremos que a serie temporal do PIB e estacionaria. 

Para o modelo (21.9.7) o valor estimado r e —1,5294, enquanto o valor crftico de 5% de r, confor- 
me observamos acima, e 2,88. Sendo que, em termos absolutos, o valor anterior e menor do que o 
ultimo, nossa conclusao e de que a serie temporal LPIB nao e estacionaria. 30 


29 Mais tecnicamene, uma vez que a Equapao (21.9.2) e uma equapao de diferenpas de primeira ordem, a cha- 
mada condipao de estabilidade requer que |p| < 1. 

30 Em outras palavras, o valor computado r deveria ser mais negativo do que o valor fundamental r, que nao e o caso 
aqui. Portanto, a conclusao permanece. Uma vez que, em geral, espera-se que S seja negativo, a estatfstica estimada 
r tera um sinal negativo. Entao, um grande valor negativo r e geralmente uma indicapao de estacionariedade. 
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O caso e o mesmo para o modelo (21.9.8). O valor computado de r de —1,8102, em termos abso- 
lutos, e menor do que o valor crftico de 5% de — 3,43. 

Portanto, com base na analise grafica, no correlograma e no teste de Dickey-Fuller, a conclusao e 
de que, para os periodos trimestrais de 1947 e 2007, a serie temporal do PIB norte-americano foi nao 
estacionaria; ela continha uma raiz unitaria, ou possufa uma tendencia estocastica. 

O teste Dickey-Fuller aumentado (DFA) 

Ao conduzir o teste DF como nas Equa£oes (21.9.2), (21.9.4) e (21.9.5), admitimos que o termo 
de erro u, era nao correlacionado. Mas para os casos em que os u, sao correlacionados, Dickey e Fuller 
desenvolveram outro teste, conhecido como teste Dickey-Fuller aumentado (DFA). Este e realiza- 
do por meio da extensao das tres equa£ 6 es anteriores adicionando os valores defasados da variavel 
dependente AY,. De modo mais especifico, suponha que utilizemos a Equafao (21.9.5). O teste DFA 
consiste aqui em estimar a seguinte regressao: 

m 

AY, = fa + p 2 t + 8Y,- \ + J2 a i AY t-i + e, (21.9.9) 

i=i 

em que s, e um termo de erro de rufdo branco puro eAf,_i = ( Y t -1 - Y t - 2 ), A Y t -2 = ( Y ,-2 - Y t - 3 ) 
etc. O numero de termos de diferen 9 as defasados a serem inclufdos e frequentemente determinado 
empiricamente; a ideia e incluir termos suficientes para que o termo de erro na Equatjao (21.9.9) seja 
serialmente nao correlacionado, para que possamos obter uma estimativa nao viesada de 8, o coefi- 
ciente defasado de Y t _ h O EViews 6 possui uma op£ao que automaticamente seleciona a extensao 
da defasagem baseada em Akaike, Schwarz e outros criterios de informa§ao. No DFA, ainda testamos 
se 8 — 0, e o teste ADF segue a mesma distribu^ao assintotica da estatlstica DF, assim os mesmos 
valores fundamentals podem ser utilizados. 

Para uma ideia sobre esse procedimento, estimamos a Equaijao (21.9.9) para a serie do PIB. Na 
medida em que temos os dados trimestrais, decidimos utilizar quatro defasagens. Os resultados da 
regressao DFA sao os seguintes : 31 

ALpIb,= 0,2677+ 0,0003? - 0,0352LPIB,_! + 0,2990ALPIB,_j + 0,1451 ALPIB f _ 2 - 0,0621 ALPIB,_ 3 - 0.0876ALPIB, 

t= (2,4130) (2,2561) (-2,3443) (4,6255) (2,1575) (-0,9205) (-1,3438) 

R 2 = 0,1617 d= 2,0075 

(21.9.10) 

O valor t ( = r) do coeficiente do LPIB,_| defasado (= 8) e —2,3443, o que, em termos absolutos, 
e muito menor do que o valor crftico de r no nivel de significancia de 10% de —3,1378, novamente 
sugerindo que mesmo depois de cuidar de possfveis autocorrela 5 oes no termo de erro, a serie LPIB e 
nao estacionaria. (Nota: o comando @ trend no EViews gera automaticamente a variavel de tendencia 
temporal determinfstica.) 

Isso poderia ser o resultado de escolhermos apenas quatro valores defasados de ALPIB? Utiliza- 
mos o criterio Schwarz usando 14 valores defasados de ALPIB, que dao o valor r 8 de —1,8102. 
Mesmo assim, esse valor r nao era significativo no nivel de 10% (o valor fundamental tan neste nfvel 
era de —3,1376). Parece que o LPIB e nao estacionario. 

Testando a significancia de mais de um coeficiente: o teste F 

Suponha que estimemos o modelo (21.9.5) e testemos a hipotese de que /l, = f J > 2 — 0, isto e, o 
modelo de passeio aleatorio e sem deslocamento e tendencia. Para testar essa hipotese conjunta, po- 
demos utilizar o teste F restrito discutido no Capitulo 8 . Isto e, estimamos a Equa^ao (21.9.5) (a re¬ 
gressao irrestrita) e estimamos a Equagao (21.9.5) novamente, sem o intercepto e a tendencia. Entao, 
utilizamos o teste F restrito como demonstrado na Equagao (8.6.9), exceto que nao podemos usar a 


31 


Diferengas com defasagem de ordem mais alta foram consideradas, mas apresentaram-se como insignificantes. 
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tabela conventional F para conseguir os valores fundamentals F. Como fizeram com a estatlstica r, 
Dickey e Fuller desenvolveram os valores crfticos de F para essa situagao, uma amostra disso e dada 
no Apendice D, Tabela D.7 Um exemplo e apresentado no Exercfcio 21.27. 

Os testes de raiz unitaria Phillips-Perron 32 

Um importante hipotese do teste DF e que os termos de erro u, sao distribufdos de forma idenpen- 
dente e identica. O teste ADF ajusta o teste DF para tratar de possfveis correla 9 des seriais nos termos 
de erro ao adicionar os termos de diferen 9 a defasados do regressando. Phillips e Perron utilizam os 
metodos estatisticos nao parametricos para tratar da correlafao serial nos termos de erro sem adicio¬ 
nar os termos de diferen 9 a defasados. Uma vez que a distribu^ao assintotica do teste Phillips-Perron 
e a mesma da estatlstica do teste ADF, nao trataremos deste assunto agora. 

Testando as mudan^as estruturais 

Os dados macroeconomicos introduzidos na Se 9 ao 21.1 (veja o site do livro para os dados reais) sao 
para o perfodo 1947-2007, um perfodo de 61 anos. Nesse perfodo, a economia norte-americana experi- 
mentou muitos ciclos de negocios de dingoes variadas. Os ciclos de negocios marcam-se por periodos 
de recessao e de expansao. E muito provavel que um ciclo de negocios seja diferente de outro, o que pode 
refletir as quebras estruturais ou mudancas estruturais na economia. 

Por exemplo, considere o primeiro embargo do petroleo em 1973. Ele quadruplicou os pre 90 s do 
petroleo. Novamente, os pre 90 s crescem substancialmente depois do segundo embargo do petroleo, 
em 1979. Naturalmente esses choques afetarao o comportamento da economia. Se formos regredir os 
gastos de consumo pessoal sobre a renda pessoal dispom'vel, o intercepto, a inclina 9 ao ou ambos 
devem modificar-se de um ciclo de negocios para outro (lembre-se do teste Chow de quebras estru¬ 
turais). Isso e o que significant as mudan 9 as estruturais. 

Perron, por exemplo, argumentou que os testes padrao da hipotese de raiz unitaria podem nao ser 
confiaveis na presen 9 a de mudan 9 as estruturais. 33 Ha varias formas de testar as mudan 9 as estruturais 
e de explica-las; a mais simples envolve o uso de variaveis dummy. Mas uma discussao dos varios 
testes de quebras estruturais nos levarao alem dos objetivos deste capftulo e e melhor deixar isso para 
as references. 34 Entretanto, veja o Exercfcio 21.28. 

Uma critica aos testes de raiz unitaria 35 

Ja discutimos varios testes de raiz unitaria e ha muitos mais. A questao e: por que ha tantos testes 
de raiz unitaria? A resposta esta no tamanho e na potencia desses testes. Por tamanho de teste, que- 
remos dizer o nivel de significancia (a probabilidade de cometer um erro Tipo I) e por potencia de um 
teste, queremos indicar a probabilidade de rejeitar a hipotese nula quando ela e falsa. A potencia de 
um teste e calculada pela subtra 9 ao da probabilidade de um erro Tipo II por Vi de 1; o erro Tipo II e a 
probabilidade de aceitar uma falsa hipotese nula. A potencia maxima e 1. A maioria dos testes de raiz 
unitaria e baseada na hipotese nula de que a serie temporal em considera 9 ao possui uma raiz unitaria; 
ela e nao estacionaria. A hipotese altemativa e que a serie temporal seja estacionaria. 

Tamanho do teste 

No Capitulo 13 fizemos a distin 9 ao entre os niveis nominais e verdadeiros de significancia. O 
teste Dickey-Fuller e sensfvel a maneira como ele e conduzido. Lembre que discutimos tres variedades 


32 PHILLIPS, P. C. B.; PERRON, P. "Testing for a unit root in time series regression." Biometrika, vl. 75, p. 335-346, 
1988. O teste Phillips-Perron agora e inclufdo em varios pacotes de software. 

33 PERRON, P. "The great crash, the oil price shock and the unit root hypothesis." Econometrica, v. 57, p. 1.361- 
-1401, 1989. 

34 Para uma discussao acessfvei, veja STOCK, James H.; Mark W. WATSON, James H. Introduction to econometrics. 2. ed. 
Boston: Pearson/Addison-Wesley, 2007, p. 565-571. Para uma discussao mais aprofundada, veja MADDALA, G. S.; 
KIM, In-Moo. Unit roots, cointegration, and structural change. Nova York: Cambridge University Press, 1998. 

35 Para uma discussao detalhada, veja MILLS, Terrence C. op. cit., p. 87-88. 
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de teste Dickey-Fuller: (1) um passeio aleatorio puro, (2) um passeio aleatorio com deslocamento e 
(3) um passeio aleatorio com deslocamento e tendencia. Se, por exemplo, o modelo verdadeiro for 
(1), mas o estimamos (2) e conclufmos que, por exemplo, no nfvel de 5% a serie temporal e estacio¬ 
naria, essa conclusao pode estar errada, porque o nivel verdadeiro de significance nesse caso e 
muito maior do que 5%. 36 O tamanho da distorgao poderia tambem resultar da exclusao dos compo- 
nentes das medias moveis do modelo (sobre medias moveis, veja o Capitulo 22). 

Potencia do teste 

A maioria dos testes do tipo Dickey-Fuller tem baixa potencia; eles tendem a aceitar a hipotese 
nula da raiz unitaria mais frequentemente do que seria seguro. Esses testes podem encontrar uma raiz 
unitaria mesmo quando nao existe nenhuma. Ha varias razoes para isso. Primeiro, a potencia depen- 
de da amplitude (de tempo) dos dados mais do que do mero tamanho da amostra. Para um exemplo de 
amostra de tamanho n, a potencia e maior quando a amplitude e maior. Portanto, um teste (ou testes) 
de raiz unitaria baseado em 30 observagoes em uma extensao de tempo de 30 anos pode ter mais 
potencia do que um baseado em, por exemplo, 100 observagoes ao longo de uma extensao de tempo 
de 100 dias. Segundo, s ep« 1, mas nao exatamente 1, o teste de raiz unitaria pode declarar que tal 
serie temporal e nao estacionaria. Terceiro, esses tipos de testes admitem uma unica raiz unitaria; eles 
admitem que a serie temporal dada e 7(1). Mas, se uma serie temporal for integrada de ordem mais 
alta do que 1, por exemplo, 1(2), havera mais do que uma raiz unitaria. No ultimo caso, pode-se utili- 
zar o teste Dickey-Pantula. 37 Quarto, se ha quebras estruturais na serie temporal (veja o capitulo 
sobre as variaveis dummy) em virtude, por exemplo, dos embargos do petroleo da Opep, os testes de 
raiz unitaria podem nao dar conta delas. 

Ao aplicar os testes de raiz unitaria, deve-se, portanto, ter em mente suas limitagoes. E claro, 
ocorreram modificagoes nesses testes feitas por Perron e Ng, Elliot, Rothenberg e Stock, Fuller e 
Leybounre. 38 Por causa disso, Maddala e Kim defendem que os testes tradicionais DF, ADDF e PP 
deveriam ser descartados. Na medida em que os pacotes econometricos incorporam os novos testes, 
isso pode muito bem acontecer. Mas devemos acrescentar que ainda nao ha nenhum teste sistemati- 
camente poderoso da hipotese de raiz unitaria. 


21.10 Transformando a serie temporal nao estacionaria 

Agora que conhecemos os problemas associados a serie temporal nao estacionaria, a questao 
pratica e o que fazer. Para evitarmos o problema da regressao espuria que pode surgir da regressao de 
uma serie temporal nao estacionaria em uma ou mais series temporais nao estacionarias, temos de 
transformar as series temporais nao estacionarias para torna-las estacionarias. O metodo de transfor- 
magao depende de as series temporais serem diferenga estacionaria (DE) ou a tendencia estacionaria 
(TE). Consideraremos cada um desses metodos na sequencia. 

Processos de diferenga estacionaria 

Se uma serie temporal tem uma raiz unitaria, as primeiras diferengas dessas series temporais sao 
estacionarias. 39 A solugao aqui e tomar as primeiras diferengas das series temporais. 

Voltando para a nossa serie temporal do LPIB dos Estados Unidos, j a vimos que ela possui uma raiz 
unitaria. Agora, vamos ver o que acontece se considerarmos as primeiras diferengas da serie LPIB. 


36 Para um experimento de Monte Carlo quanto a isso, veja CHAREMZA et al., op. cit., p. 114. 

37 DICKEY, D. A.; PANTULA, S. "Determining the order of differencing in autoregressive processes." Journal of 
Business and Economic Statistics, v. 5, p. 455-461, 1987. 

38 Uma discussao sobre esses testes pode ser encontrada em MADDALA et al., op. cit., cap. 4. 

39 Se uma serie temporal e 1(2), ela contera duas rafzes unitarias, e neste caso teremos que diferenciar duas vezes. 
Se ela for 1(d), devera ser diferenciada d vezes, em que d e qualquer numero inteiro. 
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FIGURA 21.9 

Primeira diferen^as 
do LPIB norte- 
-americano, de 1947 
a 2007 

(trimestralmente). 


Serie temporal da DLPIB 



Seja ALPIB, = (LPIB, — LPIB, ,Por conveniencia, seja D, — ALPIB,. Agora considere a se- 
guinte regressao: 


A D,= 0,00557 - 0,671 lA-i 

t = (7,1407) (-11,0204) (21.10.1) 

R 2 = 0,3360 d = 2,0542 

O valorcrftico do rde Dickey-Fullerao nivel de significanciade 1% e —3,4574. Uma vez que r( = t) 
calculado de —11,0204 e mais negativo do que o valor crftico, conclulmos que a serie das primeiras 
ditcrencas do LPIB e estacionaria; ela e 1(0). Isso e demonstrado na Figura 21.9. Se compararmos a 
Figura 21.9 com a Figura 21.1, veremos a drlcrcnca obvia entre os dois PIBs. 

Processo estacionario em tendencia 

Como vimos na Figura 21.5, o processo de tendencia estacionaria e estacionario em torno da linha 
de tendencia. Portanto, a maneira mais simples de fazer tal serie temporal estacionaria e regredi-la no 
tempo e os reslduos dessa regressao entao serao estacionarios. Em outras palavras, realize a seguinte 
regressao: 

Y, = Pi + p 2 t+u, (21.10.2) 

em que Y, e a serie temporal em estudo e t e variavel tendencial medida cronologicamente. 

Agora, 

u t = (Y t - A- fat) (21.10.3) 

sera estacionaria. u, e conhecida como serie temporal (linearmente) sem tendencia. 

E importante observar que a tendencia pode ser nao linear. Por exemplo, ela pode ser 

1 + , 63 1 2 + Uf (21.10.4) 

que e uma serie tendencial quadratica. Se for esse o caso, os reslduos a partir da Equa 5 ao (21.10.4) 
serao agora series temporais (quadraticamente) sem tendencia. 

Deve ser assinalado que, se uma serie temporal for estacionaria nas diferen 5 as, mas a tratarmos 
como tendencia estacionaria, isso sera chamado de subdiferencia^ao. Por outro lado, se uma serie 
temporal for de tendencia estacionaria, mas a tratarmos como estacionaria nas diferen 5 as, isso sera 
chamado de superdiferenciacao. As consequencias desses tipos de erros de especificapao podem ser 
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FIGURA 21.10 

As primeiras 
diferengas (ALPIB) e 
desvios a partir da 
tendencia (RESI1) 
para o LPIB, 
1947-2007 
(trimestralmente). 


ALPIB 



serias, dependendo de como se lida com as propriedades da correla 9 ao serial dos termos de erro re- 
sultantes. 40 

Para ver o que acontece se confundirmos uma serie com tendencia estacionaria com uma serie 
diferen^a estacionaria, ou vice-versa, a Figura 21.10 mostra as primeiras diferen 9 as do LPIB e os 
resfduos do LPIB estimados por meio da regressao do processo de tendencia estacionaria 
( 21 . 10 . 2 ): 

A observapao dessa figura diz que as primeiras diferenpas do LPIB real sao estacionarias (como 
confirmado pela regressao (21.10.1)), mas os residuos da linha de tendencia (RESI1) nao o sao. 

Resumindo: “[...] e muito importante aplicar o tipo certo de estacionariza 9 ao para os dados, se elas 
nao sao ainda estacionarias. A maioria dos mercados financeiros gera prepo, taxa ou dados dos rendi- 
mentos que sao nao estacionarios devido a tendencia estocastica mais do que a tendencia determims- 
tica. Raramente e apropriado a remo 9 ao de tendencia dos dados ao ajustar a linha de tendencia e tomar 
desvios. Em vez disso, os dados devem softer remo 9 ao de tendencia por meio das primeiras diferen- 
9 as, normalmente dos logaritmos das taxas e pre 90 s, porque, entao, os dados estacionarios transfor- 
mados corresponderao aos retornos do mercado”. 41 


21.11 Cointegra^ao: regressao de uma serie temporal com raiz 
unitaria contra outra serie temporal com raiz unitaria 

Afirmamos que a regressao de uma serie temporal nao estacionaria em outra serie temporal nao 
estacionaria pode produzir uma regressao espuria. Consideremos os dados da serie temporal de des- 
pesas de consumo pessoal reais e renda real dispomvel introduzidos na Se 9 ao 21.1 (veja o site do li- 
vro para obter dados reais). Submetendo essas series temporais individualmente para a analise da raiz 
unitaria, descobriremos que as duas sao 7(1); elas contem uma tendencia estocastica. E bem possivel 
que as duas series compartilhem a mesma tendencia para que a regressao de uma ou de outra nao seja 
necessariamente espuria. 

Para sermos especificos, utilizaremos os dados da serie temporal da economia norte-americana 
(veja a Se 9 ao 21.1 e o site do livro) e efetuaremos a seguinte regressao de LDCP em LRPD: 

LDCP, = /Si + /6 2 LRPD, + u, (21.11.1) 


40 Para uma discussao detalhada sobre isso, veja MADDALA et al., op. cit., Segao 2.7. 

41 ALEXANDER, Carol, op. cit., p. 324. 
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em que L denota o logaritmo. /3 2 e a elasticidade das despesas de consumer pessoal reais com respeito 
a renda real pessoal dispomvel. Para propositos ilustrativos, ela sera chamada de elasticidade de con- 
sumo. Vamos escrever isso assim: 

u, = LDCP, - fi\- ftLRPD, (21.11.2) 

Suponhamos que submetamos u, a analise da raiz unitaria e descubramos que ela e estacionaria; 
ela e 1(0). Essa e uma situagao interessante, porque, embora LDCP, e LRPD, sejam individualmente 
7(1), isto e, tenham tendencias estocasticas, sua combinagao linear (21.11.2) e 7(0). Supostamente, a 
combinagao linear elimina a tendencia estocastica em duas series. Se considerarmos consumo e renda 
duas variaveis 7(1), as economias definidas como (renda - consumo) poderiam ser 7(0). Como resul- 
tado, uma regressao do consumo em relagao a renda como na Equagao (21.11.1) seria significativa 
(nao espuria). Nesse caso, dizemos que as duas variaveis sao cointegradas. Economicamente falan- 
do, as duas variaveis serao cointegradas se tiverem uma relagao de longo prazo, ou de equilibrio, 
entre elas. A teoria economica e frequentemente expressa em termos de equilibrio, como a teoria 
quantitativa da moeda, de Fischer, ou a teoria da paridade do poder de compra (PPP), apenas para 
citar algumas. 

Em resumo, desde que verifiquemos que os residuos das regressoes como (21.11.1) sao 7(0) ou 
estacionarios, a metodologia de regressao tradicional (incluindo os testes 1 e F) que consideramos 
exaustivamente e aplicavel aos dados que envolvem a serie temporal (nao estacionaria). A valiosa 
contribuigao dos conceitos de raiz unitaria, cointegragao etc. serve para forgar-nos a descobrir se os 
residuos da regressao sao estacionarios. Como Granger observa: “Um teste para a cointegragao pode 
ser pensado como um pre-teste para evitar as situagoes de ‘regressao espuria’”. 42 

Na linguagem da teoria da cointegragao, uma regressao como a Equagao (21.11.1) e conhecida 
como regressao de cointegragao e o parametro de inclinagao e conhecido como parametro 
de cointegragao. O conceito de cointegragao pode ser estendido para o modelo de regressao con- 
tendo os regressores k. Nesse caso, teremos parametros de cointegragao k. 

Teste de cointegragao 

Varios metodos para testar a cointegragao foram propostos na literatura especializada. Considere- 
mos aqui um metodo comparativamente simples, chamado de teste de raiz unitaria de Dickey-Fuller 
ou teste Dickey-Fuller aumentado sobre os residuos estimados da regressao de cointegragao. 43 

Teste Engle-Granger ou teste Engle-Granger aumentado 

Ja sabemos como aplicar os testes de raiz unitaria de Dickey-Fuller ou Dickey-Fuller aumentado. 
Tudo o que temos a fazer e estimar uma regressao como a Equagao (21.11.1), obter os residuos e usar 
os testes Dickey-Fuller ou Dickey-Fuller aumentado. 44 Entretanto, ha uma precaugao a tomar. Uma 
vez que o u, estimado e baseado no parametro de cointegragao estimado fi 2 , os valores criticos de 
Dickey-Fuller ou Dickey-Fuller aumentado nao sao muito apropriados. Engle e Granger calcularam 
esses valores, que podem ser encontrados nas referencias. 45 Entao, os testes Dickey-Fuller ou 


42 GRANGER, C. W. J. "Developments in the study of co-integrated economic variables." Oxford Bulletin of Economics 
and Statistics, 1986. v. 48, p. 226. 

43 Ha essa diferenga entre os testes para a raiz unitaria e os testes para a cointegragao. Como David A. Dickey, 
Dennis W. Jansen e Daniel I. Thornton observam: "Os testes para as rafzes unitarias sao realizados em series temporais 
univariadas [isto e, unicas]. Por sua vez, a cointegragao lida com a relagao entre um grupo de variaveis, em que 
(incondicionalmente) cada uma delas possui uma raiz unitaria". Veja os artigos dos autores citados: "A primer on 
cointegration with an application to money and income." Economic Review, p. 59, mar.-abr. 1991, Federal Reserve 
Bank of St. Louis. Como o nome sugere, esse artigo e uma excelente introdugao ao teste de cointegragao. 

44 Se o DCP e o RPD nao sao cointegrados, qualquer combinagao linear deles sera nao estacionaria e o u t sera 
tambem nao estacionario. 

45 ENGLE, R. F.; GRANGER, C. W. "Co-integration and error correction: representation, estimation and testing." 
Econometrica, 1987. v. 55, p. 251-276. 
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Dickey-Fuller aumentado neste contexto sao conhecidos como testes Engle-Granger (EG) e 
Engle-Granger aumentado. Contudo, varios pacotes de software apresentam agora esses valores 
crfticos juntamente com outros resultados. 

Vamos ilustrar esses testes. Utilizando os dados introduzidos na Sepao 21.1 e encontrados no site 
do livro, primeiro regredimos os LDCPC contra os LRPDC e obtemos a seguinte regressao: 

LDCP, = - 0,1942 + 1,0114LRPD, 

t= (-8,2328) (348,5429) (21.11.3) 

R 2 = 0,9980 d= 0,1558 

Uma vez que o LDCP e o LRPD sao individualmente nao estacionarios, ha a possibilidade de que essa 
regressao seja espuria. Mas, quando realizamos um teste de raiz unitaria sobre os residuos obtidos da 
Equapao (21.11.3), obtemos os seguintes resultados: 

Am, = - 0, 0764m,_ i 

t= (-3,0458) (21.11.4) 

R 2 = 0,0369 d= 2,5389 


Os valores crfticos assintoticos de 5% e 10% de Engle-Granger sao cerca de —3,34 e —3,04, respectiva- 
mente. Portanto, os residuos da regressao nao sao estacionarios no nfvel de 5%. Seria diffcil aceitar essa 
razao, ja que a teoria economica sugere que deveria haver uma relapao estavel entre DCP e RPD. 

Vamos reestimar a Equapao (21.11.3) incluindo a variavel de tendencia e, entao, verificar se os 
residuos dessa equapao sao estacionarios. Primeiro, apresentamos os resultados e depois discutimos 
o que pode acontecer. 


LDCP, = 2,8130 + 0,0037, + 0,5844LRPD, 

t= (21,3491) (22,9394) (31,2754) 

R 2 = 0,9994 d = 0,2956 


(21.11.3o) 


Para verificar se os residuos dessa regressao sao estacionarios, obtemos os seguintes resultados 
(compare com a Equapao (21.11.4)): 


Am, = - 0. 1498m, 
t= (-4,4545) 

R 2 = 0,0758 d = 2,3931 


(21.11.4o) 


Not a: m, e o resfduo da Equapao (21.11. 3a). 

O teste Dickey-Fuller agora mostra que esses residuos sao estacionarios. Mesmo se utilizarmos o 
Dickey-Fuller aumentado com varias defasagens, os residuos ainda serao estacionarios. 

O que ocorre aqui? Embora os residuos da regressao (21.11.4a) sejam estacionarios, isto e, sejam 
7(0), eles sao estacionarios em torno de uma tendencia temporal determinfstica, a tendencia, aqui, 
sendo linear. Ou seja, os residuos sao 7(0) mais a tendencia linear. Como anteriormente observado, 
uma serie temporal pode apresentar tanto tendencia determinfstica quanto estocastica. 

Antes de prosseguirmos, deveria ser observado que nossos dados de serie temporal cobrem um longo 
periodo de tempo (61 anos). E bem possivel que, devido as mudanpas estruturais na economia norte- 
-americana ao longo desse perfodo, nossos resultados e conclusoes tendam a serem diferentes. No Exer- 
cicio 21.28, sera solicitado que voce verifique essa possibilidade. 


Cointegra^ao e mecanismo de corregao de erro (MCE) 

Acabamos de demonstrar que, assumindo a existencia de uma turbulencia linear, LDCP e LRPD 
parecem ser cointegrados, isto e, ha uma relapao de longo prazo, ou de equilibrio, entre os dois. E 
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claro, a curto prazo pode haver desequilfbrio. Portanto, podemos tratar o termo de erro na seguinte 
equagao como o “erro de equilfbrio”. E podemos utilizar esse termo de erro para vincular o compor- 
tamento de curto prazo do DCP para o valor de longo prazo 

u, = LDCP, - ft - ftLRPD - ft? (21.11.5) 

O mecanismo de corregao de erro (MCE) primeiramente utilizado por Sargan 46 e posteriormente 
popularizado por Engle e Granger corrige o desequilfbrio. Um teorema importante, conhecido como teo- 
rema de representagao de Granger, afirma que, se duas variaveis Y e X sao cointegradas, a relagao 
entre as duas pode ser expressa como um mecanismo de corregao de erro. Para verificar o que isso signi- 
fica, voltemos ao nosso exemplo DCP-RPD. Agora, considere o seguinte modelo: 

ALDCP, = a 0 + oq ALRPD, + a 2 u,_ i + e t (21.11.6) 

em que s, e um termo de erro de rufdo branco e u t _\ e o valor defasado do termo de erro na Equagao 
(21.11.5). 

A equagao do mecanismo de corregao de erro (21.11.5) afirma que ALDCP depende de ALRPD 
e tambem do termo de erro de equilfbrio. 47 Se o ultimo e diferente de zero, o modelo esta fora de 
equilfbrio. Suponha que ALRPD seja zero e u,_ l seja positivo. Isso significa que LDCP,.., e elevado 

demais para estar em equilfbrio, isto e, LDCP,_j esta acima do seu valor de equilfbrio de 
(cto + «i LRPD,_ i). Ja que se espera que a 2 seja negativo, o termo a 2 n,_ 1 e negativo e, portanto, 
LDCP, sera negativo para recuperar o equilfbrio. Se LDCP, estiver abaixo do seu valor de equilfbrio, 
ele comegara a cair no proximo perfodo para corrigir o erro de equilfbrio; daf o nome mecanismo de 
corregao de erro. Do mesmo modo, se u,_\ for negativo (LDCP estiver abaixo do seu valor de equi¬ 
lfbrio), a 2 u r _i sera positivo, o que tornara ALDCP/ positivo, levando LDCP/ a aumentar no perfodo 
?. Assim, o valor absoluto de a, decide quao rapidamente o equilfbrio sera recuperado. Na pratica, 
estimamos u,_\ por u t - \ = (LDCP, — ft — ftLRPD - ft?). Tenha em mente que se espera que o 
coeficiente de corregao de erro, a 2 , seja negativo (por que?). 

Voltando ao nosso exemplo ilustrativo, a contraparte empirica da Equagao (21.11.6) e: 

ALDCP, = 0,0061 + 0,2967ALRPD, - 0,12231/,-! 

?= (9,6753) (6,2282) (-3,8461) (21.11.7) 

R 2 = 0,1658 t/= 2,1496 

Estatisticamente, o termo MCE e significativo, sugerindo que DCP ajusta-se a RPD com uma defasa- 
gem; apenas cerca de 12% da discrepancia entre o DCP de longo prazo e o de curto prazo e corrigido 
dentro de um trimestre. 

Por meio da regressao (21.11.7), verificamos que a elasticidade do consumo de curto prazo e 
de cerca de 0,29. A elasticidade de longo prazo e de cerca de 0,58, que pode ser verificada pela 
Equagao (21.11.3a). Antes de concluirmos esta segao, a precaugao externada por S. G. Hall mere- 
ce ser lembrada: 

Embora o conceito de cointegragao seja claramente uma importante base teorica do modelo de corregao 
de erro, ha ainda varios problemas que envolvem sua aplicagao; os valores crfticos e o desempenho da 
amostra pequena de muitos desses testes sao desconhecidos para um vasto conjunto de modelos; a 
inspegao informada do correlograma pode ainda ser uma ferramenta importante . 48 


46 SARGAN, J. D. "Wages and prices in the United Kingdom: a study in econometric methodology." In: WALLIS, K. 
F.; HENDRY, D. F. (Eds.). Quantitative economics and econometric analysis. Oxford, U.K.: Basil Blackwell, 1984. 

47 A seguinte discussao e baseada em KOOP, op. cit., p. 159-160 e PETERSON, Kerry, op. cit., segao 8.5. 

48 HALL, S. G. "An application of the Granger and Engle two-step estimation procedure to the United Kingdom 
aggregate wage data." Oxford Bulletin of Economics and Statistics, v. 48, n. 3, p. 238, ago. 1986. Veja tambem 
CAMPBELL, John Y.; PERRON, Pierre. "Pitfalls and opportunities: what macroeconomists should know about 
unit roots." NBER (National Bureau of Economic Research) Macroeconomics Annual 1991, p. 141-219. 
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21.12 Algumas aplica^oes economicas 


Conclufmos este capftulo analisando alguns exemplos concretos. 


EXEMPLO 21.1 

Ml Oferta 
mensal de moeda 

l nos Estados 
Unidos, de 

A Figura 21.11 mostra a oferta de moeda Ml para os Estados Unidos, de janeiro de 1959 
a 1 ° de margo de 2008. Com base em nosso conhecimento de estacionariedade, parece que a 
serie temporal de oferta de moeda Ml e nao estacionaria, o que pode ser confirmado pela 
analise de raiz unitaria. ( Nota: para economizar espago, nao forneceremos os dados reais, que 

podem ser obtidos 

com o Federal Reserve Board ou o Federal Reserve Bank de St. Louis.) 

janeiro de 1959 



a 1° de marco de 

AM 

t = - 0,1347+ 0,0293t- 0,0102!W t _i 

2008 


t= (-0,14) (2,62) (-2,30) ( 21 . 12 . 1 ) 



R 2 = 0,0130 d = 2,2325 

FIGURA 21.11 
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Numero de observa 5 oes 


Os valores crfticos de r de 1,5 e 10 % sao —3,9811, —3,4210 e —3,1329. Uma vez que o 
valor t de —2,30 e menos negativo do que quaisquer desses valores fundamentals, a conclu- 
sao e de que a serie temporal Ml e nao estacionaria; ela contem uma raiz unitaria ou e /(I). 
Mesmo quando varios valores defasados de A M t (a la Dickey-Fuller aumentado) foram intro- 
duzidos, a conclusao nao se modifica. Por outro lado, as primeiras diferengas da oferta de 
moeda Ml mostraram ser estacionarias (verifique isso). 


EXEMPLO 21.2 

A taxa de juros 
dos EUA/Reino 
Unido: janeiro 
de 1971 a abril 
de 2008 


A Figura 21.12 fornece o grafico da taxa de juros ($/£) a partir de janeiro de 1971 ate abril 
de 2008, por um total de 286 observagoes. Neste momento, voce deveria ser capaz de iden- 
tificar essa serie temporal como nao estacionaria. Levando a cabo os testes de raiz unitaria, 
obtemos as seguintes estatfsticas r: —0,82 (sem intercepto, sem tendencia), —1,96 (intercepto) 
e —1,33 (intercepto e tendencia). Cada uma dessas estatfsticas, em valores absolutos, era 
inferior aos seus valores crfticos de r com base nas tabelas apropriadas Dickey-Fuller, entao 
confirma-se a impressao do grafico de que a serie temporal da taxa de juros dos EUA/Reino 
Unido e nao estacionaria. 


( Continua ) 
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EXEMPLO 21.2 

( Continuagao ) 

FIGURA 21.12 

A taxa de juros dos 
EUA/Reino Unido: 
janeiro de 1971 a 
abril de 2008. 



EXEMPLO 21.3 

Indice de pregos 
ao consumidor 
norte-americano 
( IPC ), janeiro de 
1947 a margo de 
2008 


A Figura 21.13 mostra o IPC norte-americano a partir de janeiro de 1947 ate mar^o de 
2008 em um total de 733 observances. A serie do IPC, como a serie do Ml considerada an- 
teriormente, mostra uma tendencia de alta sustentada. O exercfcio de raiz unitaria deu os 
seguintes resultados: 


AlPCt = - 0,01082+ 0,00068t - 0,00096IPC f _! + 0,40669AIPC t _i 

t= (- 0,54) (4,27) (-1,77) (12,03) ( 21 . 12 . 2 ) 

R 2 = 0,3570 d= 1,9295 


FIGURA 21.13 

IPC norte- 
-americano, janeiro 
de 1947 a mar§o 
de 2008. 



O valor t ( = t) de IPC t n e —1,77. O valor crftico a 10% e —3,1 31 7. Posto que, em termos 
absolutos, o t computado seja menor do que o r fundamental, a conclusao e de que o IPC 
nao e uma serie temporal estacionaria. Podemos caracteriza-la como uma tendencia estocas- 
tica (por que?). Entretanto, se tomarmos as primeiras diferen^as da serie IPC, vamos desco- 
brir que ela e estacionaria. Portanto, o IPC e uma serie temporal estacionaria em diferengas. 
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EXEMPLO 21.4 

As taxas de 
letras do Tesouro 
norte-americano 
de 3 e 6 meses 
sdo 

cointegradas ? 


A Figura 21.14 apresenta as taxas de letras do Tesouro norte-americano de 3 e 6 meses 
(maturidade constante) a partir de janeiro de 1982 ate margo de 2008, por um total de 315 
observances. O grafico mostra que as duas taxas sao cointegradas, isto e, ha uma relagao de 
equilibrio entre as duas? Com base na teoria financeira, esperarfamos que esse fosse o caso, 
senao os arbitradores explorariam qualquer discrepancia entre as taxas de curto e longo pra- 
zo. Antes de tudo, verificaremos se as duas series temporais sao estacionarias. 

Segundo o modelo de passeio aleatorio puro (sem intercepto, nem tendencia), ambas as 
taxas eram estacionarias. Incluindo o intercepto, a tendencia e a diferen^a defasada, os resultados 
sugeriam que as duas taxas deveriam ser de tendencia estacionaria; o coeficiente da tendencia 
em ambos os casos foi negativo e significative ao redor do nfvel de 7%. Dependendo de quais 
resultados aceitemos, as duas taxas sao tanto estacionarias como estacionarias com tendencia. 


Fazendo a regressao da taxa de Letras do Tesouro de 6 meses contra a taxa de letras do 
Tesouro de 3 meses, obtivemos a seguinte regressao. 

f§6,= 0,0842 + 1,0078TB3 t 

f = (3,65) (252,39) ( 21 . 12 . 3 ) 

R 2 = 0,995 d= 0,4035 


FIGURA 21.14 

Taxas de letras do 
Tesouro de 3 e 6 
meses (maturidade 
constante). 



Ano 


Aplicando o teste de raiz unitaria aos resfduos da regressao precedente, descobrimos que 
os resfduos eram estacionarios, sugerindo que as taxas de Letras do Tesouro de 3 e 6 meses 
eram cointegradas. Com base nesse conhecimento, obtivemos o seguinte modelo de corre- 
5 §o de erro: 

ATB6( = - 0,0047 + 0,8992ATB3 t - 0,18556,^ 

t = (- 0,82) (47,77) (-5,69) ( 21 . 12 . 4 ) 

R 2 = 0,880 d = 1,5376 

em que u t _\ e o valor defasado do termo de corregao de erro a partir do perfodo anterior. 
Como esses resultados mostram, 0,19 da discrepancia nas duas taxas no mes anterior e 
eliminada nesse mes. 49 Alem disso, as mudanfas de curto prazo na taxa de Letras do Tesou¬ 
ro de 3 meses sao rapidamente refletidas na taxa de Letras do Tesouro de 6 meses, na me- 
dida em que o coeficiente de inclinafao entre as duas seja 0,8992. Nao deveria ser uma 
surpresa encontrar isso, em vista da eficiencia dos mercados financeiros norte-americanos. 


49 Uma vez que ambas as taxas de Letras do Tesouro estao em porcentagem, isso sugeriria que, se a taxa de Letras 
do Tesouro de 6 meses fosse maior do que a taxa de Letras do Tesouro de 3 meses, mais do que o esperado a 
priori no ultimo mes, este mes ela seria reduzida a em 0,19 pontos percentuais para restituir a relapao de longo 
prazo entre as duas taxas de juros. Para a teoria sobre a relagao entre as taxas de juros de curto e longo prazo, veja 
qualquer livro sobre moeda e bancos e leia sobre a estrutura de termo das taxas de juros. 
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Resumo e 
conclusoes 


EXERCICIOS 


1. A analise da regressao baseada nos dados da sene temporal admite implicitamente que as series 
temporais subjacentes sao estacionarias. Os classicos testes t. Fete., baseiam-se nessapremissa. 

2. Na pratica, a maioria das series temporais economicas e nao estacionarias. 

3. Diz-se que o processo estocastico e fracamente estacionario se sua media, variancia e autocova- 
riancias forem constantes ao longo do tempo (ou seja, eles sao invariantes no tempo). 

4. Em um nfvel informal, a estacionariedade fraca pode ser testada pelo correlograma de uma serie 
temporal, que e um grafico de autocorrelat^ao em varias defasagens. Para a serie temporal esta¬ 
cionaria, o correlograma enfraquece rapidamente, enquanto para a serie temporal nao estacionaria, 
ele enfraquece gradualmente. Para uma serie puramente aleatoria, as autocorrela£6es em todas as 
defasagens, 1 e superiores, sao zero. 

5. Em um nivel formal, a estacionariedade pode ser verificada ao descobrirmos se a serie temporal 
content uma raiz unitaria. Os testes Dickey-Fuller e Dickey-Fuller aumentado podem ser uti- 
lizados para esse proposito. 

6. Uma serie temporal economica pode ser estacionaria com tendencia ou estacionaria em dife- 
ren^as. Uma serie temporal estacionaria com tendencia tem uma tendencia determim'stica, en¬ 
quanto uma serie temporal estacionaria em diferen£as possui uma tendencia variavel ou estocastica. 
A pratica comum de incluir a variavel temporal ou de tendencia em um modelo de regressao para 
remover a tendencia dos dados ejustificavel apenas para a serie temporal estacionaria com tenden¬ 
cia. Os testes Dickey-Fuller e Dickey-Fuller aumentado podem ser aplicados para determinar se 
uma serie temporal e estacionaria com tendencia ou estacionaria em diferen£as. 

7. A regressao de uma variavel de serie temporal sobre uma ou mais variaveis de series temporais 
pode proporcionar resultados sem sentido ou espurios. Esse fenomeno e conhecido como regressao 
espuria. Uma forma de prevenir-se contra ela e descobrir se as series temporais sao cointegradas. 

8. Cointegra^ao significa que, a despeito de serem individualmente nao estacionarias, uma combi- 
na§ao linear de duas ou mais series temporais pode ser estacionaria. Os testes Engle-Granger e 
Engle-Granger aumentado podem ser utilizados para descobrir se duas ou mais series temporais 
sao cointegradas. 

9. A cointegra 9 ao de duas (ou mais) series temporais sugere que ha rela£ao de longo prazo, ou de 
equilfbrio, entre elas. 

10.0 mecanismo de corre^ao de erro desenvolvido por Engle e Granger e um meio de reconci- 
liar o comportamento de curto prazo de uma variavel economica com o seu comportamento de 
longo prazo. 

11.0 campo da econometria de series temporais esta evoluindo. Os resultados estabelecidos e os 
testes sao, em alguns casos, experimentais e ainda resta muito trabalho. Uma questao importante 
que precisa de uma resposta e por que algumas series temporais economicas sao estacionarias e 
outras, nao estacionarias. 


21.1. O que quer dizer estacionariedade fraca? 

21.2. O que quer dizer serie temporal integrada? 

21.3. Qual o significado de raiz unitaria? 

21.4. Se uma serie temporal e 7(3), quantas vezes voce teria de diferencia-la para torna-la estacionaria? 

21.5. O que sao os testes Dickey-Fuller e Dickey-Fuller aumentado? 

21.6. O que sao os testes Engle-Granger e Engle-Granger aumentado? 

21.7. Qual o significado de cointegra 5 ao? 

21.8. Qual a difcrcnca, se ha alguma, entre os testes de raiz unitaria e os de cointegra 5 ao? 

21.9. O que e uma regressao espuria? 
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21.10. Qual a ligagao entre cointegragao e regressao espuria? 

21.11. Qual a diferenga entre tendencia determimstica e tendencia estocastica? 

21.12. O que significa processo estacionario com tendencia e processo estacionario em diferengas? 

21.13. O que e um (modelo) de passeio aleatorio? 

21.14. “Para um processo estocastico de passeio aleatorio, a variancia e infinita.” Voce concorda? 
Por que? 

21.15. O que e o mecanismo de corregao de erro? Qual sua relagao com a cointegragao? 

Exercfcios aplicados 

21.16. Utilizando os dados da serie temporal da economia dos Estados Unidos apresentados no site 
do livro, obtenha correlogramas amostrais de ate 36 defasagens para a serie temporal LDCP, 
LRPD, LLC (lucres) e LDividendos. Qual padrao geral voce verifica? Intuitivamente, 
qual(is) dessa(s) serie(s) temporal(is) parece(m) ser estacionaria(s)? 

21.17. Para cada serie temporal do Exerclcio 21.16, utilize o teste Dickey-Fuller para descobrir se essas 
series contem uma raiz unitaria. Se existir, como voce caracterizaria tais series temporais? 

21.18. Continue com o Exerclcio 21.17. Como voce decidiria se um teste Dickey-Fuller aumenta- 
do e mais apropriado do que um teste Dickey-Fuller? 

21.19. Considere as series temporais dos dividendos e dos lucres nos dados da serie temporal da 
economia norte-americana apresentados no site do livro. Posto que os dividendos depen- 
dem dos lucres, considere o seguinte modelo simples: 

LDividendos, = /i| + /IjLLC + u, 

a. Voce esperaria que essa regressao sofresse o fenomeno da regressao espuria? Por que? 

b. Sao cointegradas as series temporais dos lucres e dos dividendos? Como voce testa isso 
explicitamente? Se, depois de testar, descobrir que elas sao cointegradas, a sua resposta 
a pergunta ( a ) mudaria? 

c. Empregue o mecanismo de corregao de erro para estudar o comportamento de curto e 
longo prazos dos dividendos em relagao aos lucres. 

d. Se voce examinar individualmente as series de dividendos e de lucres, elas exibem ten- 
dencias estocasticas ou determinlsticas? Quais testes utilizaria? 

*e. Admita que dividendos e lucres sao cointegrados. Em vez de estimar a regressao dos 
dividendos contra os lucres, estime a regressao dos lucres contra os dividendos. Essa 
regressao e valida? 

21.20. Considere as primeiras diferengas da serie temporal fornecidas pelos dados da serie tempo¬ 
ral da economia norte-americana, apresentado no site do livro, e crie um grafico com elas. 
Obtenha tambem um correlograma de cada serie temporal e de ate 36 defasagens. O que o 
impressiona quanto a esses correlogramas? 

21.21. Em vez de estimar uma regressao dos dividendos contra os lucres na forma do nrvel, supo- 
nha que voce estime uma regressao das primeiras diferengas dos dividendos contra as pri¬ 
meiras diferengas dos lucres. Voce incluiria o intercepto nessa regressao? Por que? 
Apresente seus calculos. 

21.22. Prossiga com o exercicio anterior. Como faria um teste para verifrcar se a regressao das 
primeiras diferengas e estacionaria? Neste exemplo, o que voce esperaria a priori e por que? 
Apresente todos os calculos. 

21.23. Com base nos dados sobre as novas construgoes do setor privado britanico (2Q para o perfo- 
do de 1948 a 1984, Terence Mills obteve os seguintes resultados da regressao: 1 


*Opcional. 

* MILLS, Terence C. op. cit., p. 127. Notagao levemente alterada. 
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A X, = 31,03 - 

0,188X,_ 

ep = (12,50) 

(0,080) 

(t= )r 

(-2,35) 


Nota: o valor crftico de r no nfvel de 5% e —2,95 e o valor crftico r no rn'vel de 10% e —2,60. 

a. Com base nesses resultados, a serie temporal de novas constr^oes e estacionaria ou nao 
estacionaria? Por outro lado, ha uma raiz unitaria nessa serie temporal? Como voce sabe 
disso? 

b. Se voce fosse utilizar o teste t habitual, o valor t observado seria estatisticamente signi¬ 
ficative? Com base nisso, voce concluiria que essa serie temporal e estacionaria? 

c. Agora considere os seguintes resultados da regressao: 

A^X, = 4,76 - l,39AA r _i + 0,313A 2 X r _! 
ep = (5,06) (0,236) (0,163) 

(f=)r (-5,89) 

em que A 2 e o operador das segundas diferen§as, isto e, a primeira diferen£a da primeira 
diferen£a. O valor r estimado e agora estatisticamente significativo. O que voce pode dizer 
sobre a estacionariedade da serie temporal em questao? 

Nota: o proposito da regressao anterior e descobrir se ha uma segunda raiz unitaria na 
serie temporal. 

21.24. Gere duas series de passeio aleatorio como indicado nas Equa£oes (21.7.1) e (21.7.2) e 
estime a regressao de uma contra a outra. Repita o exerclcio, mas utilize as suas primeiras 
diferenpas e verifique que nessa regressao o valor R 2 e cerca de zero e o cl Durbin-Watson 
e proximo de 2. 

21.25. Para mostrar que duas variaveis, cada qual com uma tendencia determimstica, podem levar 
a regressao espuria, Charemza et al. obtiveram a seguinte regressao baseada em 30 obser- 
vapoes:* 

Y, = 5,92 + 0,030X, 
t= (9,9) (21,2) 

R 1 = 0,92 d = 0,06 

em que Y\ = 1, 7 2 = 2,. . . , Y n = n e X\ = 1, X 2 - 4, . . ., X„ - n 2 . 

a. Que tipo de tendencia Y exibe? EX? 

b. Crie um grafico das duas variaveis e um da linha de regressao. Que conclusao geral voce 
extrai desses graficos? 

21.26. Com base nos dados para o periodo de 1971-la 1988-IV no Canada, os seguintes resultados 
da regressao foram obtidos: 

1. lnMT,= - 10,2571 + 1,5975 In PIB, 

t = (- 12,9422) (25,8865) 

R 2 = 0,9463 cl = 0,3254 

2. A4nMT,= 0,0095 + 0,5833AlnPIB ( 

t= (2,4957) (1,8958) 

R 2 = 0,0885 d= 1,7399 


CHAREMZA et al., op. cit., p. 93. 
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3. A ii t = - 0,1958m,_ i 

(t= r) (-2,2521) 

R 2 - 0,1118 d = 1,4767 

em que Ml e a oferta de moeda, PIB e o produto interno bruto, ambos medidos em bilhoes 
de dolares canadenses, In e o logaritmo natural e u, representa os residues estimados da 
primeira regressao. 

a. Interprete as regressoes (1) e (2). 

b. Voce suspeita que a regressao (1) seja espuria? Por que? 

c. A regressao (2) e espuria? Como voce sabe disso? 

d. Com base nos resultados da regressao (3), voce modificaria sua conclusao de (/?)? Por 
que? 

e. Agora considere a seguinte regressao: 

0,0084 + 0,7340A In PIB, - 0, 0811m, 

(2,0496) (2,0636) (-0,8537) 

R 2 = 0,1066 d= 1,6697 

O que essa regressao informa? Ajuda a decidir se a regressao (1) e espuria ou nao? 

21.27. As seguintes regressoes sao baseadas nos dados do IPC dos Estados Unidos para o perfodo 
1960-2007, para um total de 48 observafoes anuais: 


AlnMl, = 
t = 


1 . 


AIPC, = 0,0334IPC,_ i 

t= (12,37) 

R 2 = 0,0703 d= 0,3663 SQR = 206,65 


2 . 


AIPC, = 1,8662 + 0,0192IPC,_i 
t= (3,27) (3,86) 

R 2 = 0,249 d = 0,4462 SQR = 166,921 


3. 


AIPC, = 
t = 


1,1611 + 0,53441- 0,1077IPC,_! 

(2,37) (4,80) (-4,02) 

R 2 = 0,507 d= 0,6071 SQR = 109,608 


em que SQR = soma dos quadrados dos reslduos. 

a. Ao examinar as regressoes anteriores, o que voce pode dizer acerca da estacionariedade 
da serie temporal IPC? 

b. Como voce escolheria entre os tres modelos? 

c. A Equa 5 ao (1) e a Equa§ao (3) menos o intercepto e a tendencia. Qual voce utilizaria 
para decidir se as restri^oes envolvidas no modelo (1) sao validas? ( Dica: utilize os 
testes Dickey-Fuller leF. Utilize os valores aproximados fornecidos no Apendice D, 
Tabela D.7.) 

21.28. Como observado no texto, pode haver varias quebras estruturais no conjunto de dados da 
serie temporal da economia norte-americana introduzido na Seijao 21.1. Variaveis dummy 
sao um bom modo de incorporar essas variacoes nos dados. 
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a. Utilizando as variaveis dummy para designar tres perfodos diferentes relacionados aos em- 
bargos ao petroleo em 1973 e 1979, regrida o logaritmo dos gastos com consumo pessoal 
no logaritmo da renda pessoal disponivel. Houve modificaqoes nos resultados? Qual sua 
decisao sobre a premissa da raiz unitaria agora? 

b. Varios sites listam os ciclos economicos oficiais que podem ter afetado os dados da serie 
temporal da economia americana discutida na Seqiao 21.1. Veja, por exemplo, http://www. 
nber.org/cycles/cyclesmain.html. Utilizando a informaqjao aqui, crie variaveis dummy indi- 
cando alguns dos ciclos e verifique os resultados da regressao de LDCP em LRPD. Houve 
modificafao? 


Capitulo 


Econometria de series 
temporais: previsao 

Observamos, na Introdui;ao, que a previsao e uma parte importante da analise econometrica; 
para algumas pessoas, e provavelmente a mais importante. Como prever as variaveis economicas, 
como o P1B, a infla 9 ao, as taxas de juros, os pregos das a 9 oes, as taxas de desemprego e as outras 
inumeras variaveis economicas? Neste capitulo, discutiremos dois metodos de previsao que se torna- 
ram muito populates: (1) processo autorregressivo integrado de media movel (ARIMA), popular- 
mente conhecido como metodologia Box-Jenkins’ e (2) vetores autorregressivos (VAR). 

Neste capitulo, tambem discutiremos os problemas especiais envolvidos na previsao dos prccos dos 
ativos financeiros, como os pre 90 S das a 9 oes e as taxas de juros. Os pre 90 S dos ativos sao caracteriza- 
dos pelo fenomeno conhecido como aglomera^ao de volatilidade, isto e, periodos nos quais eles 
exibem grandes oscila 9 oes para um perfodo prolongado de tempo seguido por um perfodo de tranqui- 
lidade comparativa. Deve-se observar o indice Dow Jones no passado recente. Os assim chamados 
modelos heterocedasticidade condicional autorregressiva (ARCH) ou heterocedasticidade condi¬ 
tional autorregressiva generalizada (GARCH) podem capturar tal aglomera 9 ao de volatilidade. 

O topico da previsao economica e vasto e livros especializados foram escritos sobre o assunto. 
Nosso objetivo, neste capitulo, e fornecer ao leitor apenas uma ideia sobre o tema. O leitor interessado 
pode consultar as referencias para estudos posteriores. Felizmente, os mais modemos pacotes econo- 
metricos possuem introd^oes de facil utiliza 9 ao para varias das tecnicas discutidas neste capitulo. 

A liga 9 ao entre este capitulo e o anterior sao os metodos de previsao discutidos a seguir, que 
admitem que as series temporais subjacentes sao estacionarias ou que podem tornar-se estacionarias 
com as transforma 9 oes apropriadas. A medida que avan 9 armos, veremos o uso de varios conceitos 
introduzidos no capitulo anterior. 


22.1 Abordagens sobre a previsao economica 


Em linhas gerais, ha cinco abordagens para a previsao economica baseadas nos dados de series 
temporais: (1) metodos de suaviza 9 ao exponencial, (2) modelos de regressao uniequacionais, (3) 
modelos de regressao de equa 9 ao simultanea, (4) processo autorregressivo integrado de media movel 
(ARIMA) e (5) modelos de vetores autorregressivos (VAR). 

Metodos de suaviza^ao exponencial 1 2 

Estes sao essencialmente metodos para ajustar uma curva adequada aos dados historicos de uma 
serie temporal dada. Ha um grande numero desses metodos, como o da suavizagao exponencial 


1 BOX, C. P. E.; JENKINS, G. M. Time series analysis: forecasting and control, ed. rev. Holden Day, Sao Francisco: 
Holden,1978. 

2 Para uma exposifao comparativamente simples desses metodos, veja MAKRIDAKIS, Spyros; WHEELWRIGHT, 
Steven C.; HYNDMAN, Rob J. Forecasting methods and applications. 3. ed. Nova York: John Wiley & Sons, 1998. 
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simples, metodo linear de Holt, metodo Holt-Winter e suas variances. Embora ainda utilizados em 
muitas areas da previsao dos negocios e da economia, eles agora sao suplantados por outros quatro 
metodos que mostraremos. Nao discutiremos os metodos de suavizagao exponencial neste capftulo, 
visto que isso nos afastaria muito de nossos objetivos. 

Modelos de regressao uniequacional 

A parte principal deste livro dedica-se aos modelos de regressao uniequacional. Como exemplo, 
considere a fungao demanda por automoveis. Com base na teoria economica, postulamos que a de- 
manda por automoveis e uma fungao dos pregos dos automoveis, dos gastos com publicidade, da 
renda do consumidor, das taxas de juros (como medida do custo do emprestimo) e outras variaveis 
relevantes (por exemplo, tamanho da familia, distancia da viagem para o trabalho). Por meio dos 
dados da serie temporal, estimamos um modelo importante para a demanda de automoveis (linear, 
log-linear ou nao linear), que pode ser utilizado para prever a demanda por automoveis no futuro. E 
claro que, como observado no Capftulo 5, os erros de previsao aumentam rapidamente se avangamos 
muito no futuro. 

Modelos de regressao de equates simultaneas 3 

Nos Capitulos 18, 19 e 20, consideramos os modelos de equagoes simultaneas. Em seu auge, 
durante os anos 1960 e 1970, modelos elaborados da economia norte-americana baseados em equa¬ 
goes simultaneas dominaram a previsao economica. Desde entao, o glamour de tais modelos declinou 
devido ao seu pobre desempenho, especialmente desde que os choques nos pregos do petroleo entre 
1973 e 1979 (causados pelos embargos ao petroleo pela Opep) e tambem devido a chamada critica 
de Lucas. 4 O ponto central dessa critica, como podemos relembrar, e que os parametros estimados 
em um modelo econometrico sao dependentes da polftica dominante no perfodo em que o modelo foi 
estimado e se modificarao, se houver uma mudanga na politica. Em resumo, os parametros estimados 
nao sao invariantes na presenga de mudangas polfticas. 

Por exemplo, em outubro de 1979, o FED (Banco Central americano) modificou dramaticamente 
sua polftica monetaria. Em vez de estabelecer metas para as taxas de juros, anunciou que, a partir de 
entao, monitoraria as taxas de crescimento da oferta de moeda. Com tal mudanga proferida, um mo¬ 
delo econometrico estimado em dados passados teria pouco valor de previsao no novo regime. Nos 
dias atuais, a enfase do FED modificou-se do controle da oferta de moeda para o controle da taxa de 
juros de curto prazo (a federal funds rate). 

Modelos ARIMA 

A publicagao por Box e Jenkins de Time series analysis: forecasting and control (op. cit.) condu- 
ziu a uma nova geragao de ferramentas de previsao. Popularmente conhecida como metodologia 
Box-Jenkins (BJ), mas tecnicamente como metodologia ARIMA, a enfase desses metodos nao esta 
na construgao dos modelos uniequacionais ou de equagoes simultaneas, mas na analise probabilistica, 
ou estocastica, das propriedades da propria serie temporal economica sob a filosofia deixe os dados 
falarem por si mesmos. Ao contrario dos modelos de regressao, no qual Y, e explicado pelos regres- 
sores kX\, X 2 , X 2 , ..., X k , os modelos de series temporais do tipo BJ permitem que Y, seja explicado 
pelos valores passados, ou defasados, do proprio Y e dos termos de erro estocastico. Por essa razao, 
os modelos ARIMA sao, por vezes, chamados modelos ateoreticos, porque nao sao derivados de 
nenhuma teoria economica — e as teorias economicas sao frequentemente a base dos modelos 
de equagoes simultaneas. 

Observe que a nossa enfase, neste capftulo, esta nos modelos ARIMA univariados, isto e, os mo¬ 
delos ARIMA pertencentes a uma serie temporal simples, mas a analise pode ser estendida aos 
modelos ARIMA multivariados. 


3 Para um tratamento didatico do uso de modelos de equagao simultanea na previsao, veja PINDYCK, Robert S.; 

RUBINFELD, Daniel L. Econometric models & economic forecasts. 4. ed. Nova York: McGraw-Hill, 1998. parte III. 

4 LUCAS, Robert E. "Econometric policy evaluation: a critique." In: CARNEGIE-ROCHESTER CONFERENCE SERIES. 
The Phillips curve. Amsterda: North-Holland, 1976. p. 19-46. Este artigo, entre outros, valeu a Lucas um Premio 
Nobel em economia. 
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Modelos VAR 

A metodologia VAR lembra superficialmente a modelagem das equa 9 oes simultaneas no sentido 
de que devemos considerar muitas variaveis endogenas em conjunto. Contudo, cada variavel endo- 
gena e explicada por seus valores defasados, ou passados, e pelos valores defasados de todas as outras 
variaveis endogenas no modelo; normalmente, nao ha variaveis exogenas no modelo. 

No restante deste capftulo, discutiremos as abordagens fundamentais de Box-Jenkins e VAR sobre 
a previsao economica. Nossa discussao e elementar e heurfstica. O leitor que desejar aprofundar-se 
mais no assunto deve consultar as referencias. 5 


22.2 Modelagem de series temporais de acordo com os metodos 
autorregressivo, das medias moveis e ARIMA. 

Para introduzir varias ideias, algumas antigas e outras novas, vamos trabalhar com os dados da 
serie temporal do PIB dos Estados Unidos, introduzido na Se 9 ao 21.1 (veja o site do livro para os 
dados atuais). Um desenho dessa serie temporal ja foi visto nas Figuras 21.1 (LPIB nao diferenciado) 
e 21.9 (LPIB com primeiras diferen 9 as); lembre que o LPIB na forma nivelada e nao estacionario, 
mas, na forma de (primeira) diferen 9 a, e estacionario. 

Se uma serie temporal e estacionaria, podemos modela-la com uma variedade de formas. 

Um processo autorregressivo (AR) 

Vamos representar por Y, o LPIB no perfodo t. Se modelarmos Y, como 


(7, - 8) = a.\(Y t -1 - 8) + u, (22.2.1) 

em que S e a media de ieu,c um erro aleatorio nao correlacionado com media zero e variancia 
constante cr (trata-se de um ruido branco ), entao diremos que Y, segue um processo autorregressivo 
estocastico de primeira ordem ou AR(1), ja encontrado no Capftulo 12. Aqui o valor de Y no perfo¬ 
do t depende do seu valor no perfodo anterior e de um termo aleatorio; os valores de Y sao expressos 
como desvios com base em um valor medio. Em outras palavras, esse modelo informa que o valor 
previsto de Y no perfodo 1 e simplesmente alguma propor 9 ao ( = oq) mais um choque aleatorio ou 
perturba 9 ao no perfodo f; novamente os valores Y sao expressos em torno dos seus valores medios. 
Mas, se considerarmos esse modelo, 

(7, - 8) = oi\(Y t - 1 - <5) + q!3(7(_2 - 5) + u t (22.2.2) 

entao diremos que 7, segue um processo autorregressivo de segunda ordem, ou AR(2). O valor de 
7 no perfodo t depende do seu valor nos dois perfodos previos, os valores de 7 sendo expressos em 
torno dos seus valores medios S. 

Em geral, pode-se ter 

(Yt ~ &)= aq(7 ( _ i - 8) + q' 2 (7,_ 2 - 5) + • • • + a p (Y t - p - 8) + u, (22.2.3) 

no caso 7,e um processo autorregressivo de ordemp-esima, ou AR(p). 

Perceba que, em todos os modelos anteriores, apenas os valores de 7 atuais e anteriores estao en- 
volvidos: nao ha outros regressores. Nesse sentido, dizemos que os “dados falam por si mesmos”. 
Eles sao um tipo de modelo de forma reduzida que encontramos em nossa discussao sobre os modelos 
de equa 9 ao simultanea. 


5 Veja PINDYCK e RUBINFELD, op. cit.. Parte 3; PANKRATZ, Alan. Forecasting with dynamic regression models. Nova 
York: John Wiley & Sons, 1991 (este e um livro pratico); e HARVEY, Andrew. The econometric analysis of time series. 
2. ed. Cambridge, Mass.: The MIT Press, 1990 (este e um livro muito avanfado). Uma discussao profunda, mas 
acessfvel, pode tambem ser encontrada em MILLS, Terence C. Time series techniques for economists. Nova York: 
Cambridge University Press, 1990. 
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Processo de media movel (MA) 

O processo AR que acabamos de discutir nao e apenas um mecanismo que pode ter gerado Y. 
Suponha que modelemos Y como se segue: 

Y, = n + Pou, + Piu t ~ i (22.2.4) 

em que /i e uma constante e u, como antes, e um termo de erro estocastico de rufdo branco. Aqui Y no 
perfodo 1 e igual a uma constante mais uma media movel dos termos de erro atuais e passados. Neste 
caso, dizemos que Y segue um processo de media movel de primeira ordem, ou um MA(1). 

Mas, se Y segue a expressao 

Yt - d + Pou t + P\u t -\ + Piu t -2 (22.2.5) 

entao e um processo MA(2). De forma mais geral. 


Y t - 1-1+ PoU t + P\U t - \ + PlUt-2 +-1 - PqUt-q 


( 22 . 2 . 6 ) 


e um processo MA(*/). Resumindo, um processo de media movel e apenas uma combina 5 ao linear de 
termos de erro de rufdo branco. 

Processo autorregressivo de medias moveis (ARMA) 

Claro, e muito provavel que Y possua caracterfsticas tanto de AR quanto de MA e seja, portanto, 
ARMA. Entao, Y, segue um processo ARMA(1,1) se pode ser escrito como 

Y, = 6 + a x Y,-i + Pou, + P\u t - 1 (22.2.7) 


porque ha um termo autorregressivo e um termo de media movel. Na Equa£ao (22.2.7) 0 representa um 
termo constante. 

Em geral, em um processo ARMA (p , q). havera termos autorregressivos p e termos de media 
movel q. 


Processo autorregressivo integrado de medias moveis (ARIMA) 

Os modelos de series temporais que ja discutimos sao baseados na supos^ao de que as series 
temporais envolvidas sao (fracamente) estacionarias no sentido definido no Capitulo 21. Em resumo, 
a media e a variancia para uma serie temporal fracamente estacionaria sao constantes e sua covarian- 
cia e invariante no tempo. Mas sabemos que muitas series temporais economicas sao nao estaciona¬ 
rias, isto e, sao integradas; por exemplo, as series temporais economicas introduzidas na Se 5 ao 21.1 
do Capftulo 21 sao integradas. 

Contudo, tambem vimos no Capftulo 21 que, se uma serie temporal for integrada de ordem 1 (isto 
e, ela e /[ 1]), suas primeiras difcrencas sao 1(0), isto e, estacionarias. Da mesma forma, se uma serie 
temporal e 1(2), sua segunda diferenfa e 1(0). Em geral, se uma serie temporal e 1(d), depois de dife- 
rencia-la d vezes, obtemos uma serie 7(0). 

Se tivermos de diferenciar uma serie temporal d vezes para torna-la estacionaria e aplicar-lhe o 
modelo ARMA (p, q), diremos que a serie temporal original e ARIMA (p, d, q), ou seja, ela e uma 
serie temporal autorregressiva integrada de medias moveis, em que p denota os numeros dos ter¬ 
mos autorregressivos, d o numero de vezes que a serie deve ser diferenciada antes de tomar-se esta¬ 
cionaria e q o numero de termos de media movel. Uma serie temporal ARIMA (2, 1, 2) deve ser 
diferenciada uma vez (d = 1) antes de tornar-se estacionaria, e a serie temporal estacionaria (de pri¬ 
meira diferen 5 a) pode ser modelada como um processo ARMA (2, 2), pois possui dois termos AR e 
dois MA. Claro, se d = 0, uma serie e estacionaria para ARMA (p, q). Observe que um processo 
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ARIMA (p, 0, 0) significa um processo AR ( p) puramente estacionario; um ARIMA (0, 0, q) significa 
um processo MA ( q ) puramente estacionario. Dados os valores de p, d e q, e possfvel dizer qual pro¬ 
cesso esta sendo modelado. 

Um ponto importante a ser observado e que, ao utilizarmos a metodologia Box-Jenkins, deve- 
mos ter tanto uma serie temporal estacionaria quanto uma serie temporal que seja estacionaria 
depois de uma ou mais diferenciagoes. Arazao para admitir a estacionariedade pode ser explicada 
como se segue: 

O objetivo do metodo Box-Jenkins e identificar e estimar um modelo estatistico que possa ser interpre- 
tado como tendo sido gerado pelos dados amostrais. Se esse modelo estimado for utilizado para a pre¬ 
visao, deveremos admitir que suas caracterfsticas sao constantes ao longo do perfodo, e, particularmente, 
ao longo de perfodos futures. A simples razao para requerer os dados estacionarios e que qualquer mo¬ 
delo que seja inferido com base nesses dados pode ser interpretado como estacionario ou estavel e, 
portanto, fomecer uma base valida para a previsao. * I * * * * 6 


22.3 A metodologia Box-Jenkins (BJ) 

A principal pergunta e: observando uma serie temporal, como a serie do P1B americano na Figura 
21.1, como podemos saber se ela segue um processo AR puro (e, se isso acontece, qual o valor de p) 
ou um processo MA puro (e, se isso acontece, qual o valor de q), um processo ARMA (e, se isso 
acontece, quais os valores de p e q) ou um processo ARIMA, no caso de precisarmos conhecer os 
valores de p, cl e tp. A metodologia BJ e muito util para se responder a questao anterior. O metodo 
consiste em quatro etapas: 

Etapa 1. Identificagao. Neste estagio descobre-se os valores apropriados de /?, d e q. Mostraremos 
rapidamente como o correlograma e o correlograma parcial auxiliam nessa tarefa. 

Etapa 2. Estimagao. Depois de identificados os valores apropriados de p e q, o proximo estagio e 
estimar os parametros dos termos autorregressivos e dos termos de media movel incluidos no mode¬ 
lo. As vezes, esse calculo pode ser feito por mfnimos quadrados simples, mas, as vezes, temos de 

I an gar mao de metodos de estimagao nao linear (nos parametros). Como essa tarefa e agora rotinei- 
ramente feita por varios pacotes estatisticos, nao devemos ficar preocupados quanto a matematica de 
estimagao; o estudante curioso pode consultar as referencia sobre isso. 

Etapa 3. Verificagao do diagnostic)). Apos escolhermos um modelo ARIMA especifico, e tendo 
estimado seus parametros, veremos a seguir se o modelo selecionado ajusta-se aos dados razoavel- 
mente bem para que seja possfvel que outro modelo ARIMA possa tambem fazer o trabalho. Esse e 
o motivo da modelagem ARIMA/Box-Jenkins ser mais arte do que ciencia; uma habilidade conside- 
ravel e requerida para escolher o modelo ARIMA correto. Um teste simples do modelo selecionado 
e verificar se os residuos estimados com base nesse modelo sao ruidos brancos; se forem, poderemos 
aceitar o ajuste especifico; do contrario, deveremos recomegar. Portanto, a metodologia BJ e um 
processo iterativo (veja a Figura 22.1). 

Etapa 4. Previsao. Uma das razoes da popularidade da modelagem ARIMA e seu sucesso na previ¬ 

sao. Em muitos casos, as previsoes obtidas por esse metodo sao mais confiaveis do que as obtidas 
por meio da modelagem econometrica tradicional, especialmente para as previsoes de curto prazo. 
Naturalmente, cada caso deve ser verificado. 

Com essa discussao geral, vamos conferir as quatro etapas com mais detalhes. Daqui em diante, 
utilizaremos os dados do PIB introduzidos na Segao 21.1 (veja o site do livro para os dados atualiza- 
dos) para ilustrar os varios pontos. 


6 POKORNY, Michael. An introduction to econometrics. Nova York: Basil Blackwell, 1987. p. 343. 
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FIGURA 22.1 

O metodo 
Box-Jenkins. 

2. Estimagao dos parametros do 
modelo escolhido 


1. Identificagao do modelo 
(escolha provisoria de p, d, q) 



22.4 Identificagao 

As principais ferramentas na identificagao sao a fungao de correlated amostral (ACF), a fun¬ 
gao de correlagao amostral parcial (PACF) e os correlogramas resultantes, que sao simplesmen- 
te as representagoes de ACF e PACF contra a extensao da defasagem. 

No capitulo anterior, definimos a ACF ( p k ) (populacional) e a fungao de correlagao amostral ACF 
(p k ). O conceito de autocorrelagao parcial e analogo ao conceito de coeficiente de regressao parcial. 
No modelo de regressao multipla com k variaveis, o k-esimo coeficiente de regressao, fi k , mede a 
taxa de variagao no valor medio do regressando para uma alteragao unitaria no k-esimo regressor, X k , 
mantendo a influencia de todos os regressores constantes. 

Da mesma forma, a correlagao amostral parcial pkk mede a correlagao entre as observagoes 
(serie temporal) que estao separadas por k periodos, depois de verificar as correlagoes nas defasa- 
gens intermediarias (defasagens menores do que k). Em outras palavras, a autocorrelagao parcial e a 
correlagao entre Y,e Y,_ k depois de remover o efeito dos Y intermediaries. 7 Na Segao 7.11, ja intro- 
duzimos o conceito de correlagao parcial no contexto da regressao e apresentamos sua relagao com 
as correlagoes simples. Tais correlagoes parciais sao agora costumeiramente computadas pela maio- 
ria dos pacotes estatfsticos. 

Na Figura 22.2, mostramos o correlograma (painel a) e o correlograma parcial (painel b ) da serie 
do LPIB. Ao observarmos essa figura, dois fatos destacam-se: primeiro, a ACF decresce muito lenta- 
mente; como mostra a Figura 21.8, ate cerca de 22 defasagens, as ACF sao individual, estatfstica e 
significativamente diferentes de zero, por estarem todas fora dos intervalos de 95% de confianga. Em 
segundo lugar, depois da segunda defasagem, a fungao parcial de autocorrelagao cai dramaticamente 
e a maioria das fungoes parciais, apos a defasagem 2, sao estatisticamente insignificantes, com exce- 
gao, talvez, da defasagem 13. 

Uma vez que a serie temporal do LPIB norte-americano nao e estacionaria, temos de torna-la 
estacionaria antes de aplicar a metodologia Box-Jenkins. Na Figura 21.9, tragamos as primeiras di- 
ferengas do LPIB. Ao contrario da Figura 21.1, nao observamos nenhuma tendencia nessa serie, 
talvez sugerindo que a serie temporal em primeiras diferengas do LPIB seja estacionaria. 8 Uma 
aplicagao formal do teste de raiz unitaria Dickey-Fuller mostra que isso e, de fato, o que acontece. 


7 Nos dados das series temporais, uma grande proporgao da correlagao entre Y, e Y t _ k pode ser decorrente das 
correlagoes com as defasagens intermediarias Y t _ 1( Y,_ 2 , . . ., Y t _([ +1 . A correlagao parcial p kk retira a influencia 
dessas variaveis intermediarias. 

8 E diffcil dizer se a variancia dessa serie e estacionaria, especialmente em torno de 1979-1980. O embargo do 
petroleo de 1979 e a mudanga significativa da polftica monetaria do FED, de 1979, pode ter algo a ver com a 
nossa dificuldade. 
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FIGURA 22.2 

(a) correlograma e ( b ) 
correlograma parcial, 
para o LPIB dos 
Estados Unidos, 
1947-1 a 2007-1V. 



Formulas de Bartlett para intervalos de con I'ianca de 95% MA(7/j. 

(a) 



Intervalos de confianca de 95% [ep = l/sqrt(«)]. 

(b) 


Podemos tambem verificar isso por meio dos correlogramas estimados da ACF e da PACF fornecidos 
nos paineis (a) e (b) da Figura 22.3. Agora, temos um padrao bem diferente da funcao de autocor- 
rela£ao e da funijao de autocorrela£ao parcial. As funcoes de autocorrela§ao nas defasagens 1, 2 e 
5 parecem estatisticamente diferentes a partir de zero; lembremos (Capftulo 21), que os limites de 
confianpa aproximados de 95% para p k sao -0,1254 e + 0,1254. ( Nota: como discutido no Capf¬ 
tulo 21, esses limites de confianca sao assintoticos e, por isso, podem ser considerados aproxima¬ 
dos.) Mas, em todas as outras defasagens, eles nao sao estatisticamente diferentes de zero. Para as 
correlagoes parciais, apenas as defasagens 1 e 12 parecem ser estatisticamente diferentes de 
zero. 

Agora, como os correlogramas fornecidos na Figura 22.3 habilitam-nos a encontrar o padrao 
ARMA da serie temporal do LPIB? (Nota: consideraremos apenas a serie em primeiras diferen 5 as 
do LPIB, porque ela e estacionaria.) Uma maneira de realizar isso e considerar a fun 5 ao de auto- 
corrclayao, a fun§ao de autocorrclaciao parcial e os correlogramas associados de um numero sele- 
cionado deprocessos de ARMA como AR(1),AR(2), MA(1), MA(2), ARMA(1, 1), ARIMA(2, 2) 
etc. Uma vez que cada um desses processos estocasticos exibe padroes tfpicos da fungao de auto- 
corrclayao e da luncao de autocorrelagao parcial, se a serie temporal em estudo ajusta-se a um 
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FIGURA 22.3 

(a) correlograma e ( b) 
correlograma parcial 
para as primeiras 
diferencas de LPIB 
dos Estados Unidos, 
1947-1 a 2007-1V. 



(a) 



Intervalos de confianija de 95% [ep = 1/sqrtOi)]. 

(b) 


desses padroes, podemos identificar a serie temporal com aquele processo. Naturalmente, teremos 
de aplicar os testes de diagnosticos para descobrir se o modelo ARMA selecionado e razoavel- 
mente preciso. 

Estudar as propriedades dos diversos processos padrao ARIMA consumiria muito espago. O que 
planejamos fazer e oferecer diretrizes gerais (veja a Tabela 22.1); as referencias podem fornecer os 
detalhes dos varios processos estocasticos. 

Perceba que as fungoes de autocorrelagao e as tuncdes de autocorrelagao parcial dos processos 
AR(p) e MAfr/) possuem padroes opostos; no caso do AR(/r), o AC decresce geometricamente ou 
exponencialmente, mas a fungao de autocorrelagao parcial e interrompida depois de certo numero de 
defasagens, enquanto o contrario acontece com um processo MAC/). 

Geometricamente, esses padroes sao exibidos na Figura 22.4. 
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TABELA 22.1 

Padroes teoreticos das 
ACF e das PACF 


Note: os termos declinio exponencial e geometrico significant a mesma coisa (lembre-se de nossa discussao sobre a defasagem 
distribuida Koyck.) 


Tipo de modelo 

Padrao tfpico de ACF 

Padrao tfpico de PACF 

AR(p) 

Declina exponencialmente ou com padrao 
de onda senoide amortecida ou ambos 

Picos significativos ate 
p defasagens 

MA(q) 

Picos significativos ate q defasagens 

Declina exponencialmente 

ARMA(p, q ) 

Queda exponencial 

Queda exponencial 


FIGURA 22.4 

ACF e PACF de 
processos estocasticos 
selecionados: (a) 
AR(2): = 0,5, 

ot 2 , = 0,3; (b) MA(2): 
Pi = 0,5, p 2 = 0,3; 

(c) ARMA (1,1): 
ot\ = 0,5, Pi = 0,5. 



Pkk 


0 



P k 


Pkk 



0 


jp 7 


(b) 


Pk 


Pkk 


0 




(C) 


Um aviso 

Uma vez que, na pratica, nao observamos as fungoes de autocorrelagao e as tunc be s de autocor- 
relagao parcial teoricas e dependemos de seus equivalentes amostrais, as fungoes de autocorrelagao e 
as t’uncbes de autocorrelagao parcial estimadas nao corresponderao exatamente aos seus equivalentes 
teoricos. O que estamos procurando e uma semelhan§a entre as fun 5 oes de autocorrela^ao e as fun- 
goes de autocorrelagao parcial teoricas e amostrais para que possam levar na direcao certa a construgao 
dos modelos ARIMA. E e por isso que a modelagem ARIMA requer muita habilidade, o que, e claro, 
vem com a pratica. 

IdentificaQao ARIMA do PIB dos Estados Unidos 

Voltando ao correlograma e ao correlograma parcial do LPIB estacionario (apos a primeira 
diferenga) dos Estados Unidos entre 1947-1 e 2007-IV fornecidos na Figura 22.3, o que podemos 
verificar? 

Lembrando que as fungoes de autocorrelagao e as fungoes de autocorrelagao parcial sao quantida- 
des amostrais, nao temos bons padroes conforme sugerido na Tabela 22.1. As autocorrelagoes (painel a ) 
decrescem para as primeiras duas defasagens e, entao, com excegao da defasagem 5, o resto delas nao 
e estatisticamente diferente de zero (a area cinza exibida nas figuras apresenta os limites de confianga 
de aproximadamente 95%). As autocorrelagoes parciais (painel h) com picos nas defasagens 1 e 12 
parecem estatisticamente significativas, mas o restante delas nao o e; se o coeficiente da correlagao 
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FIGURA 22.5 

(a) correlograma e (b) 
correlograma partial 
ou residuos do 
modelo MA(2) para 
as primeiras 
diferengas do LPIB, 
dos Estados Unidos, 
1947-1 a 2007-IV. 



(a) 



(b) 


partial fosse significativo apenas na defasagem 1, poderiamos te-lo identificado como urn modelo 
AR(1). Vamos, entao, admitir que o processo que gerou a serie LPIB (a primeira diferenga) seja um 
processo MA(2). Tenha em mente que a menos que, a fungao de autocorrelagao e a fungao de auto¬ 
correlagao partial nao sejam bem definidas, e dificil escolher um modelo sem tentativa e erro. O 
leitor e encorajado a tentar outros modelos ARIMA na serie LPIB com primeiras diferengas. 


22.5 Estima^ao do modelo ARIMA 


Consideremos que Yf denote as primeiras dit’crencas do LPIB dos Estados Unidos. Entao, nosso 
modelo temporariamente identificado de AR e: 


Y* - II + PiU t - i + @2^1-2 


( 22 . 5 . 1 ) 
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Utilizando o MINITAB, obtivemos as seguintes estimativas: 


Y; = 0,00822+ 0,2918 m,_ 
ep = (0,00088) (0,0633) 
t = (9,32) (4,61) 

R 2 = 0,1217 


+ 0,2024m,_ 2 
(0,0634) 
(3,20) 
d= 1,9705 


(22.5.2) 


Deixamos esse modelo como um exerclcio para que o leitor estime outros modelos ARIMA para a 
primeira serie diferenciada do LPIB. 


22.6 Verifica^ao do diagnostico 

Como sabemos que o modelo na Equagao (22.5.2) ajusta-se razoavelmente aos dados? Um 
diagnostico simples e obter reslduos com base na Equagao (22.5.2) e obter a fungao de autocorrela¬ 
gao e a fungao de autocorrelagao parcial desses reslduos ate, por exemplo, a defasagem 25. A fungao 
de autocorrelagao e a fungao de autocorrelagao parcial estimadas sao exibidas na Figura 22.5. Como 
essa figura mostra, nenhuma das autocorrelagoes (painel a) e autocorrelagoes parciais (painel b) e 
significativa estatistica e individualmente. Tampouco a soma dos quadrados das 25 autocorrelagoes, 
como demonstrado pelas estatlsticas Box-Pierre Q e Ljung-Box (LB) (veja o Capftulo 21), e estatis- 
ticamente significativa. Em outras palavras, os correlogramas tanto da autocorrelagao quanto da au¬ 
tocorrelagao parcial dao a impressao de que os reslduos estimados por meio da Equagao (22.5.2) sao 
puramente aleatorios. Portanto, nao deve haver qualquer necessidade de procurar por outro modelo 
ARIMA. 

22.7 Previsao 

Lembremos que os dados do PIB referem-se ao perlodo entre 1947-1 a 2007-IV. Suponha, com 
base no modelo (22.5.2), que queiramos prever o LPIB para os primeiros quatro trimestres de 2008. 
Mas, na Equagao (22.5.2), a variavel dependente e a variagao no LPIB ao longo do trimestre anterior. 
Entao, se utilizamos a Equagao (22.5.2), o que podemos obter sao as previsoes das variagoes do LPIB 
entre o primeiro trimestre de 2008 e o quarto trimestre de 2007, o segundo trimestre de 2008 ao longo 
do primeiro trimestre de 2008 etc. 

Para obtermos a previsao do nlvel do LPIB, em vez de suas variagoes, podemos “desfazer” a 
transformagao das primeiras diferengas que utilizamos para obter as variagoes. (Mais tecnicamente, 
integramos a serie das primeiras diferengas.) Entao, para obtermos o valor da previsao do LPIB (nao 
do ALPIB) para 2008-1, reescrevemos o modelo (22.5.1) como: 

^2008-1 “ ^2007-IV “ M + A«2007-IV+ /bW2007-III + «2008-I (22.7.1) 


Ou seja, 

12008-1 = M + /I 1 M 2007 -IV + ^2^2007-111 + “2008-1 + ^2007-IV (22.7.2) 

Os valores de /i, /l, e /C ja sao conhecidos por meio da regressao estimada (22.5.2). Supomos que 
o valor de M 2008-1 se j a zero (P°r que?). Portanto, podemos facilmente obter o valor previsto para 
12008 — 1 - A estimativa numerica desse valor previsto e: 9 


9 Embora pacotes convencionais de computador fagam esse calculo habitualmente, mostramos os calculos deta- 
Ihados para ilustrar o mecanismo envolvido. 





778 


Parte Quatro Modelos de equagdes simultaneas e econometria de series temporais 


^ 2008-1 — 0,00822+ (0,2918)m2oo7-iv + (0,2024)(m2oo7-iii) + ^2007-iv 
= 0,00822+ (0,2918)(0,00853)+ (0,2024)(- 0,00399) + 9,3653 
= 9,3741(aproximadamente) 

Assim, o valor de previsao do LPIB para o primeiro semestre de 2008 e cerca de 9,3741, que 
corresponde a cerca de $ 11.779 bilhdes (em dolares de 2000). Por acaso, o valor atual do PIB real 
para o primeiro semestre de 2008 foi de $ 11.693.09 bilhoes; o erro da previsao foi uma superestima- 
tiva de $ 86 bilhoes. 


22.8 Outros aspectos da metodologia BJ 

Nos paragrafos anteriores, fomecemos apenas uma introdugao superficial sobre a modelagem 
BJ. Ha varios aspectos dessa metodologia que nao consideramos por falta de espago, por exemplo, 
a sazonalidade. Muitas series temporais exibem comportamento sazonal. Exemplos disso sao as 
vendas de lojas de departamentos no perfodo de festas, o consumo sazonal de sorvete, as viagens 
durante as ferias etc. Se, por exemplo, tivermos dados trimestrais sobre as vendas das lojas de departa¬ 
mentos, as vendas mostrarao picos no quarto trimestre. Em tais situagoes, pode-se remover a influencia 
sazonal ao deduzir as diferengas das vendas no quarto trimestre e, entao, decidir que tipo de modelo 
ARIMA ajustar. 

Analisamos apenas uma unica serie temporal por vez, mas nada impede que a metodologia 
BJ seja estendida ao estudo simultaneo de duas ou mais series. Uma incursao nesse topico nos 
levaria muito longe; o leitor interessado pode querer consultar as referencias. 10 Na proxima 
segao, entretanto, discutiremos esse topico no contexto daquilo que e conhecido como autorre- 
gressao vetorial. 


22.9 Vetores autorregressivos (VAR) 

Nos Capitulos 18a 20, consideramos os modelos de equagoes simultaneas ou estruturais. Em tais 
modelos, algumas variaveis sao tratadas como endogenas e algumas como exogenas, ou predetermi- 
nadas (exogenas mais endogenas defasadas). Antes de estimarmos esses modelos, devemos ter certe- 
za de que as equagoes no sistema sao identificadas (exatamente ou superidentificadas). Essa 
identificagao e frequentemente alcangada ao admitirmos que algumas das variaveis predeterminadas 
estao presentes apenas em algumas equagoes. Essa decisao e normalmente subjetiva e foi criticada 
severamente por Christopher Sims. 11 

De acordo com Sims, se ha uma simultaneidade verdadeira entre um conjunto de variaveis, 
todas elas devem ser tratadas em pe de igualdade; nao deveria haver qualquer distingao a priori 
entre as variaveis endogenas e exogenas. E com esse espirito que Sims desenvolveu o seu modelo 

VAR. 

As sementes desse modelo ja haviam sido plantadas no teste de causalidade de Granger, discutido 
no Capftulo 17. Nas Equa 5 oes (17.14.1) e (17.14.2), que explicam o LPIB atual em termos de oferta 
de moeda defasada e LPIB defasado, e oferta de moeda atual em termos de oferta de moeda defasa- 
da e LPIB defasado, respectivamente, estamos tratando essencialmente de LPIB e de oferta de moeda 
como um par de variaveis endogenas. Nao ha variaveis endogenas nesse sistema. 

De forma semelhante, no Exemplo 17.13, examinamos a natureza da causalidade entre a moeda e 
a taxa de juros no Canada. Na cquacpto da moeda, apenas os valores defasados da moeda e da taxa de 
juros aparecem e, na equagao da taxa de juros, apenas os valores defasados da taxa de juros e da 
moeda aparecem. 


10 Para um tratamento acessfvel desse assunto, veja MILLS, Terence C. op. cit., parte III. 

11 SIMS, C. A. "Macroeconomics and reality." Econometrica, 1980. v. 48, p. 1-48. 
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Ambos os exemplos sao ilustragoes de modelos de vetores autorregressivos; o termo autorre- 
gressivo deve-se a aparencia do valor defasado da variavel dependente no lado direito e o termo velar 
deve-se ao fato de que estamos lidando com um vetor de duas (ou mais) variaveis. 


Estimagao do VAR 

Voltando ao exemplo da taxa de juros e da moeda canadenses, vimos que, ao introduzirmos seis 
defasagens de cada variavel como regressores, nao podlamos rejeitar a hipotese de que havia causa- 
lidade bilateral entre a moeda ( M x ) e taxa de juros, R (taxa de juros corporativa de 90 dias). Isto e, M x 
afeta R e R afeta M\. Esses tipos de situagdes sao idealmente ajustadas para a aplicagao de VAR. 

Para explicar como um VAR e estimado, prosseguiremos com o exemplo anterior. Por ora, admi- 
timos que cada equagao content k valores de defasagem de M (como mensurado por M \) e R. Neste 
caso, pode-se estimar cada uma das seguintes equagoes por MQO: 12 


M\ t = a + 

R, = a' + 


k k 


r.PjMt-j + Zrj R t-j + Uu 

j= 1 j= 1 

(22.9.1) 

k k 

22 QjMt-j + + u 2t 

j= l j= l 

(22.9.2) 


em que os u sao os termos de erro estocastico, chamados impulsos ou inovagoes ou choques, na lin- 
guagem do VAR. 

Antes de estimarmos as Equagoes (22.9.1) e (22.9.2), devemos decidir sobre o comprimento 
maximo de defasagem, k. Essa e uma questao empirica: temos, ao todo, 40 observagoes; incluir 
varios termos defasados consumira graus de liberdade, sem mencionar a introdugao da possibi- 
lidade de multicolinearidade; incluir muitas defasagens levara a erros de especificagao. Uma 
forma de decidir a questao e utilizar um criterio como o Akaike ou o Schwarz e escolher qual 
modelo oferece os menores valores desses criterios. E indiscutivel que alguma tentativa e erro 
seja inevitavel. 

Para ilustrarmos a mecanica, inicialmente usamos quatro defasagens (k = 4) de cada variavel e, 
utilizando o EViews 6, obtivemos as estimativas dos parametros das duas equagoes anteriores, forne- 
cidas na Tabela 22.2. Observe que, embora nossa amostra situe-se entre 1979-1 e 1988-IV, utilizamos 
a amostra para o perfodo entre 1980-1 e 1987-IV e guardamos as ultimas quatro observagoes para 
verificar a exatidao da previsao do VAR ajustado. 

Visto que as equagoes anteriores sao regressoes por MQO, o resultado da regressao fornecido na 
Tabela 22.2 deve ser interpretado da maneira habitual. Com varias defasagens das mesmas variaveis, 
cada coeficiente estimado nao sera estatisticamente significativo, possivelmente em virtude da mul¬ 
ticolinearidade. Porem, coletivamente, eles podem ser significativos com base no teste padrao F. 

Examinemos os resultados apresentados na Tabela 22.2. Primeiro, consideremos a regressao M x . 
Individualmente, apenas M x na defasagem 1 e R nas defasagens 1 e 2 sao estatisticamente significa- 
tivas. Contudo, o valor F e tao alto que nao podemos rejeitar a hipotese de que coletivamente todos 
os termos defasados sejam estatisticamente significativos. Voltando a regressao da taxa de juros, ve- 
mos que todos os quatro termos de moeda defasada sao individualmente e estatisticamente significan- 
tes (a 10% ou melhor nfvel), enquanto apenas a variavel de taxa de juros defasada de 1 perfodo e 
significativa. 

Para propositos comparativos, apresentamos na Tabela 22.3 os resultados do VAR baseados ape¬ 
nas em 2 defasagens de cada variavel endogena. Aqui veremos que, na regressao da moeda, a varia¬ 
vel de moeda defasada de 1 perfodo e ambos os termos defasados de taxa de juros sao individualmente 


12 Pode-se utilizar a tecnica SURE (regressoes aparentemente nao correlacionadas) para estimar as duas equagoes 
conjuntamente. Contudo, uma vez que cada regressao contem o mesmo numero de variaveis endogenas de- 
fasadas, a estimagao por MQO de cada equagao produz separadamente estimativas identicas (e eficientes). 
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TABELA 22.2 

Estimativas dos 
vetores 

autorregressivos 
baseadas em 4 
defasagens 


Amostra (ajustada): 1980-1 a 1987—IV 

Observagoes inclufdas: 32 depois de ajustar os pontos extremos 
Erros padrao em () e estatfsticas t em [ ] 



Mi 

R 

Mi (-1) 

1,076737 (0,201 74) [5,33733] 

0,001282 (0,00067) [1,90083] 

Mi (-2) 

0,173433 (0,31444) [0,55157] 

- 0,002140 (0,001 05) [- 2,03584] 

Mi (- 3) 

-0,366465 (0,34687) [-1,05648] 

0,0021 76 (0,00116) [1,87699] 

Mi (-4) 

0,077602 (0,20789) [0,37329] 

-0,001479 (0,00069) [-2,12855] 

K(-1) 

-275,0293 (57,2174) [-4,80675] 

1,139310 (0,19127) [5,95670] 

«(- 2) 

227,1750 (95,3947) [2,38142] 

- 0,309053 (0,31888) [- 0,9691 7] 

«(- 3) 

8,511851 (96,9176) [0,08783] 

0,052361 (0,32397) [0,16162] 

«(- 4) 

- 50,19926 (64,7554) [- 0,77521 ] 

0,001076 (0,21646) [0,00497] 

C 

241 3,827 (1622,65) [1,48759] 

4,919000 (5,42416) [0,90687] 


R 2 

0,988154 

0,852890 

R 2 ajustado 

0,984034 

0,801 721 

Soma dos quadrados dos resfduos 

4820241, 

53,86233 

Equagao do EP 

457,7944 

1,530307 

Estatfstica F 

239,8315 

16,66815 

Log verossimilhanga 

-236,1676 

-53,73716 

A/C de Akaike 

15,32298 

3,921073 

SC de Schwarz 

15,73521 

4,33331 1 

Dependente media 

28514,53 

11,67292 

DP dependente 

3623,058 

3,436688 


Determinante da matriz de 490782,3 

covariancia dos resfduos 

Log verossimilhanga - 300,4722 

Criterio de informagao de Akaike 19,90451 

Criterio de Schwarz 20,72899 


e estatisticamente significativos. Na regressao da taxa de juros, ambos os termos de moeda de- 
fasada (no nfvel de 5%, aproximadamente) e um termo de juro defasado sao individualmente 
significativos. 

Se tivessemos de escolher entre o modelo da Tabela 22.2 e o da Tabela 23.3, qual deles escolherfa- 
mos? Os valores de informagao de Akaike e Schwarz para o modelo da Tabela 22.2 sao, respectiva- 
mente, 15,32 e 15,73, enquanto os valores correspondentes para a Tabela 22.3 sao 15,10 e 15,33. 
Visto que, quanto mais baixos os valores das estatfsticas Akaike e Schwarz, melhor o modelo, parece 
que o modelo mais parcimonioso apresentado na Tabela 22.3 e preferfvel. Tambem consideramos 6 
defasagens de cada uma das variaveis endogenas e descobrimos que os valores das estatfsticas Akaike 
e Schwarz foram 15,37 e 15,98, respectivamente. Novamente, a escolha parece ser o modelo com 
dois termos defasados de cada variavel endogena, isto e, o modelo da Tabela 22.3. 

Previsao com VAR 

Suponha que escolhamos o modelo da Tabela 22.3. Podemos utiliza-lo para prever os valores de 
;V/| e R. Lembremos que nossos dados cobrem os perfodos de 1979-1 a 1988-IV, mas nao utilizamos 
os valores de 1988 ao estimarmos os modelos VAR. Agora, suponha que queiramos prever o valor de 
M | para 1988-IV, isto e, o primeiro trimestre de 1988. O valor da previsao para 1988-1 pode ser obti- 
do como se segue: 
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TABELA 22.3 

Estimativas dos 
vetores 

autorregressivos 
baseadas em 2 
defasagens 


Amostra (ajustada): 1979-111 a 1987-IV 

Observa^oe inclufdas: 34 depois de ajudar os pontos extremos 
Erros padrao em () e estatisticas t em [ ] 


Mi 

Mi (-1) 1,037537 (0,16048) [6,46509] 

Mi (-2) -0,044661 (0,15591) [-0,28646] 

R(-1) -234,8850 (45,5224) [-5,15977] 

R (- 2) 160,1560 (48,5283) [3,30026] 

C 1451,977 (1185,59) [1,22468] 


R 

0,001091 (0,00059) [1,85825] 
-0,001255 (0,00057) [-2,19871] 
1,069081 (0,16660) [6,41708] 

- 0,223364 (0,1 7760) [- 1,25768] 
5,796434 (4,33894) [1,33591] 


R 2 

0,988198 

0,806660 

R 2 ajustado 

0,986571 

0,779993 

Soma dos quadrados dos residuos 

5373510. 

71,97054 

Equagao do EP 

430,4573 

1,575355 

Estatfstica F 

607,0720 

30,24878 

Log verossimilhanga 

-251,7446 

-60,99215 

A/C de Akaike 

15,10263 

3,881891 

SC de Schwarz 

15,32709 

4,106356 

Dependente media 

28216,26 

11,75049 

DP dependente 

3714,506 

3,358613 

Determinante da matriz de 
covariancia dos residuos 

458485,4 


Log verossimilhan^a 

-318,0944 


Criterio de informa^ao de Akaike 

19,29967 


Criterio de Schwarz 

19,74860 



988— i — 1451,977+ l,0375Mi987-iv - 0,0446A/i987_ni 
— 234,8850T?i987-iv + 160,15607? 1987- hi 

em que os valores do coeficiente sao obtidos com base na Tabela 22.3. Agora, usando os valores 
adequados deM l s R com base na Tabela 17.5, o valor da previsao da moeda para o primeiro trimes- 
tre de 1988 pode ser de 36.996 (milhoes de dolares canadenses). O valor real de M x para 1988-1 era 
de 36.480, que significa que nosso modelo fez uma previsao superestimada do valor real em cerca 
de 516 (milhoes de dolares), que e cerca de 1,4% do M x real para 1988-1. Naturalmente, essas esti¬ 
mativas serao modificadas, dependendo de quantos valores defasados considerarmos no modelo 
VAR. Deixamos como exerclcio, que o leitor faga a previsao do valor de R para o primeiro trimestre 
de 1988 e a sua comparagao desse valor com o seu valor real para aquele trimestre. 

VAR e casualidade 

Discutimos o topico da causalidade no Capftulo 17. La, consideramos os testes de causalidade 
Granger e Sims. Ha alguma conexao entre VAR e causalidade? No Capftulo 17 (Segao 17.14), vimos 
que acima de 2, 4 e 6 defasagens havia causalidade bilateral entre M x e R, mas, na defasagem 8, nao 
havia nenhuma causalidade entre as duas variaveis. Os resultados sao mistos. Agora, podemos recor- 
dar o Capftulo 21 e o teorema da representagao de Granger. Uma das implicagoes desse teorema e 
que, se duas variaveis, por exemplo, X r e Y t , sao cointegradas e cada uma e individualmente /(1), isto 
e, integrada de ordem 1 (cada uma e individualmente nao estacionaria), X, deve causar Y, por Granger 
ou Y, deve causar X, por Granger. 

Em nosso exemplo, isso significa que, se M x e R forem individualmente 7(1), mas forem coin- 
tegrados, M x deve causar R por Granger ou R deve causar M x por Granger. Isso significa que de- 
vemos primeiro descobrir se duas variaveis sao 7(1) individualmente e descobrir se elas sao 
cointegradas. Se esse nao for o caso, toda a questao da casualidade pode tornar-se controversa. No 
Exercfcio 22.22, pede-se ao leitor que descubra se as duas variaveis sao nao estacionarias, mas 







782 Parte Quatro Modelos de equagdes simultaneas e econometria de series temporais 


TABELA 22.4 

Resultados da 
estima§ao do sistema 
VAR de segunda 
ordem* para o Texas: 
1974-1 a 1988-1 

Fonte: Economic Review, 
Federal Reserve Bank of 
Dallas, p. 21, jan. 1989. 


Variavel dependente: x 

(porcentagem da varia^ao do prefo real do petroleo) 

Variavel 

Defasagem Coeficiente 

Erro padrao 

Nivel de significancia 

X 

1 

0,7054 

0,1409 

0,8305E- 5 

X 

2 

-0,3351 

0,1500 

0,3027E- 1 

y 

1 

-1,3525 

2,7013 

0,6189 

y 

2 

3,4371 

2,4344 

0,1645 

Z 

1 

3,4566 

2,8048 

0,2239 

Z 

2 

-4,8703 

2,7500 

0,8304E- 1 

Constante 

0 

- 0,9983E- 2 

0,1 696E- 1 

0,5589 

R = 0,2982; Q(21) = 

8,2618 (P= 0,9939) 



Testes de significance conjunta, variavel dependente = x 


Variavel 


Estatistica F 


Nivel de significancia 

X 


12,5536 


0,4283E-4 

y 


1,3646 


0,2654 

Z 


1,5693 


0,2188 

Variavel dependente: y (porcentagem da varia^ao do emprego nao agricola no Texas) 

Variavel 

Defasagem Coeficiente 

Erro padrao 

Nivel de significancia 

X 

1 

0,2228E- 1 

0,8759E- 2 

0,1430E- 1 

X 

2 

- 0,1883E- 2 

0,9322E-2 

0,8407 

y 

1 

0,6462 

0,1678 

0,3554E- 3 

y 

2 

0,4234E- 1 

0,1512 

0,7807 

Z 

1 

0,2655 

0,1742 

0,1342 

z 

2 

-0,1715 

0,1708 

0,3205 

Constante 

0 

- 0,1602E- 2 

0,1053E- 1 

0,1351 

R = 0,6316; Q(21) = 

21,5900 (P = 0,4234) 



Testes para significancia conjunta, variavel dependente = y 


Variavel 


Estatistica F 


Nivel de significancia 

X 


3,6283 


0,3424E-4 

y 


19,1440 


0,8287E- 6 

Z 


1,1684 


0,3197 

Variavel dependente: z 

(porcentagem da varia^ao do emprego nao agrfcola no restante 

dos Estados Unidos) 




Variavel 

Defasagem Coeficiente 

Erro padrao 

Nivel de significancia 

X 

1 

- 0,8330E- 2 

0,6849E- 2 

0,2299 

X 

2 

0,3635E- 2 

0,7289E- 2 

0,6202 

y 

1 

0,3849 

0,1312 

0,51 70E- 2 

y 

2 

- 0,4805 

0,1182 

0,1828E- 2 

Z 

1 

0,7226 

0,1362 

0,3004E- 5 

Z 

2 

- 0,1 366E-1 

0,1336 

0,9190 

Constante 

0 

- 0,2387E- 2 

0,8241 E-3 

0,5701 E-2 

R 2 = 0,6503; Q(21) = 

15,6182 (P = 0,7907) 



Testes de significancia conjunta, variave dependente = z 


Variavel 


Estatistica F 


Nivel de significancia 

X 


0,7396 


0,4827 

y 


8,2714 


0,8360E- 3 

Z 


27,9609 


0,1 000E- 7 


*Dois termos defasados para cada variavel. 
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cointegradas. Se voce fizer o exercicio, descobrira que ha uma fraca evidencia de cointegragao 
entre M x e R, sendo que este e o motivo pelo qual os testes de casualidade discutidos na Se£ao 
17.14 estao equivocados. 

Alguns problemas da modelagem VAR 

Os defensores da VAR enfatizam as seguinte virtudes do metodo: (1) o metodo e simples; nin- 
guem precisa preocupar-se em determinar quais variaveis sao endogenas e quais sao exogenas; todas 
as variaveis em VAR sao endogenas 13 (2) a estima 5 ao e simples; o metodo habitual dos MQO pode 
ser aplicado em cada equa§ao separadamente; (3) as previsoes obtidas por esse metodo sao, em 
muitos casos, melhores do que as obtidas com base em modelos mais complexos de equa£oes simul¬ 
taneas. 14 

Porem, os criticos da modelagem VAR apontam os seguintes problemas: 

1. Diferentemente dos modelos de equates simultaneas, um modelo VAR e ateorico, porque 
utiliza menos informaqao previa. Lembre-se de que, nos modelos de equafoes simultaneas, 
a exclusao ou inclusao de certas variaveis tem um papel fundamental na identificaqao do 
modelo. 

2. Devido a sua enfase na previsao, os modelos VAR sao menos adaptados para a analise polftica. 

3. O maior desafio pratico na modelagem VAR e escolher a extensao apropriada das defasa- 
gens. Suponha que tenhamos um modelo VAR de tres variaveis e decidamos incluir oito 
defasagens de cada variavel em cada equaqao. Voce tera 24 parametros defasados em cada 
equac^ao mais o termo constante, para um total de 25 parametros. A menos que o tamanho da 
amostra seja grande, estimar tantos parametros consumira varios graus de liberdade, com 
todos os problemas associados a isso. 15 

4. De modo estrito, em um modelo VAR de m-variaveis, todas as variaveis m deveriam ser 
(conjuntamente) estacionarias. Se esse nao for o caso, teremos de transformar os dados 
adequadamente (por exemplo, pela diferen£a de primeira ordem). Como observa Harvey, 
os resultados com base nos dados transformados podem nao ser satisfatorios. Mais adian- 
te, ele observa que: “A abordagem habitual adotada pelos aficionados pela VAR e, portanto, 
o trabalho em rn'veis, mesmo se algumas dessas series sejam nao estacionarias. Nesse 
caso, e importante reconhecer o efeito das raizes unitarias sobre a distribui£ao dos 
estimadores”. 16 E e ainda pior se o modelo contiver um mix das variaveis 7(0) e 7(1), ou 
seja, um mix de variaveis estacionarias e nao estacionarias; neste caso, transformar os 
dados nao sera facil. 

Contudo, Cuthbertson argumenta que: “a analise da cointegra 5 ao indica que um VAR ape- 
nas nao e especificado nas primeiras diferen^as se houver alguns vetores cointegrantes pre- 
sentes entre as series 7(1). Em outras palavras, um VAR somente nas primeiras diferen 5 as 
omite variaveis estacionarias potencialmente importantes (os vetores de correcao de erro e 
vetores de cointegraqao) e, portanto, as estimativas do parametro podem sofrer uma tenden- 
cia de variaveis omitidas”. 17 

5. Posto que os coeficientes individuals nos modelos estimados VAR sao frequentemente difi- 
ceis de interpretar, os adeptos dessa tecnica em geral estimam a chamada fun^ao de respos- 
ta a impulso (ou impulse response function - IRF). A IRF delineia a resposta da variavel 


13 As vezes, variaveis puramente exogenas sao inclindas para permitir fatores de tendencias e sazonais. 

14 Veja, por exemplo, KINAL, T.; RATNER, J. B. "Regional forecasting models with vector autoregression: the case 
of New York State." Discussion Paper #155, Department of Economics, State University of New York at Albany, 
1982. 

15 Se tivermos um modelo VAR de m equagoes com valores defasados p das variaveis m, em todos teremos de 
estimar ( m + pm 2 ) parametros. 

16 HARVEY, Andrew. The econometric analysis of time series. 2. ed. Cambridge, Mass.: The MIT Press,, 1990. p. 83. 

17 CUTHBERTSON, Keith. Quantitative financial economics: stocks, bonds and foreign exchange. Nova York: John 
Wiley e Sons, 2002. p.436. 
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dependente no sistema VAR aos choques nos termos de erro, como u\ e u 2 nas Equagoes 
(22.9.1) e (22.9.2). Suponha que U\ na equagao M x aumente por um valor de desvio padrao. 
Tal choque ou variagao modificara M x no presente, bem como nos perfodos futures. Mas, 
visto que M x aparece na regressao R, a variagao em u\ tera tambem um impacto sobre R. Da 
mesma forma, uma variagao de um desvio padrao em u 2 da equagao R tera um impacto sobre 
M |. AIRF delineia o impacto de tais choques por varios perfodos no future. Embora a utili- 
dade da analise IRF seja questionada por pesquisadores, ela e o ponto central da analise 
VAR. 18 

Para uma comparagao do desempenho do VAR com outras tecnicas de previsao, o leitor pode 
consultar as references. 19 

Uma aplicagao de VAR: um modelo VAR da economia do Texas 

Para testar a sabedoria popular: (“Para onde o petroleo for, para la vai a economia do Texas”), 
Thomas Fomby e Joseph Hirschberg desenvolveram um modelo VAR de tres variaveis da economia 
texana para o perfodo entre 1974—1 e 1988—I. 20 As tres variaveis consideradas foram: (1) porcenta- 
gem da variagao do prego real do petroleo, (2) porcentagem da variagao do emprego nao agricola do 
Texas e (3) porcentagem da variagao do emprego nao agricola no restante dos Estados Unidos. Os 
autores introduziram o termo constante e os dois valores defasados de cada variavel em cada equagao. 
Portanto, o numero de parametros estimados em cada equagao foi sete. Os resultados da estimagao 
por meio dos MQO do modelo VAR sao fornecidos na Tabela 22.4. Os testes F fornecidos na tabela 
servem para testar a hipotese de que, coletivamente, os varios coeficientes defasados sao zero. Por¬ 
tanto, o teste F para a variavel x (porcentagem da variagao do prego real do petroleo) demonstra que 
ambos os termos defasados de x sao estatisticamente diferentes de zero; a probabilidade de obter um 
valor F de 12,5536 sob a hipotese nula de que sejam ambos simultaneamente iguais a zero e muito 
baixa, cerca de 0,00004. Por outre lado, coletivamente, os dois valores defasados y (porcentagem da 
variagao do emprego nao agricola do Texas) nao sao significativamente diferentes de zero para expli- 
car x; o valor F e de apenas 1,36. Todas as outras estatfsticas F devem ser interpretadas de forma se- 
melhante. 

Com base nesses e noutros resultados apresentados no seu artigo, Fomby e Hirschenberg con- 
cluem que a sabedoria popular sobre a economia do Texas nao e muito precisa, ja que depois da ins- 
tabilidade inicial resultante dos choques do petroleo da Opep, a economia texana e agora menos 
dependente das flutuagoes do prego do petroleo. 


22.10 Medindo a volatilidade na serie temporal financeira: 
os modelos ARCH e GARCH 

Como observamos na introdugao deste capitulo, a series temporais financeiras, bem como os 
pregos das agoes, as taxas de cambio, as taxas de inflagao etc., frequentemente apresentam o fenome- 
no da aglomeragao por volatilidade, isto e, perfodos nos quais os pregos apresentam grandes osci- 
lagoes por um perfodo de tempo extenso seguido por perfodos nos quais ha relativa calma. Como 
Philip Franses observa: 


18 RUNKLE, D. E. "Vector autoregression and reality." journal of Business and Economic Statistics, ^ 987. v. 5, p. 437- 
454. 

19 MCNEES, S. "Forecasting accuracy of alternative techniques: a Ccmparison of U.S. macroeconomic forecasts." 
journal of Business and Economic Statistics, v. 4, p. 5-15, 1986; e MAHMOUD, E. "Accuracy in forecasting: a 
survey." journal of Forecasting, 1984. v. 3, p. 139-159. 

20 FOMBY, Thomas B.; HIRSCHBERG, Joseph C. "Texas in transition: dependence on oil and the national economy." 
Economic Review, Federal Reserve Bank of Dallas, jan. 1989. p. 11 -28. 
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Uma vez que os dados [da serie temporal financeira] refletem o resultado do comercio entre comprado- 
res e vendedores em, por exemplo, mercados de agoes, muitas fontes de notfcias e outros eventos eco- 
nomicos exogenos podem ter um impacto no padrao da serie temporal dos pregos dos ativos. Dado que 
as notlcias podem levar a interpretagoes variadas, e tambem dado que eventos economicos especlficos 
como uma crise do petroleo podem durar por algum tempo, frequentemente observamos que grandes 
observagdes positivas ou grandes observagoes negativas em series temporais financeiras tendem a apa- 
recer em aglomerados. 21 

O conhecimento da volatilidade e de suma importancia em muitas areas. Por exemplo, trabalho 
macroeconomico consideravel foi feito para estudar a variabilidade da inflagao ao longo do tempo. 
Para alguns tomadores de decisao, a inflagao em si mesma pode nao ser ruim, porem sua variabili¬ 
dade e ruim, porque torna o planejamento financeiro dificil. 

O mesmo e verdadeiro quanto aos importadores, exportadores e comerciantes nos mercados 
de cambio, porque a variabilidade nas taxas de cambio pode significar grandes perdas ou lucros. 
Os investidores, no mercado de agoes, estao obviamente interessados na volatilidade dos pregos 
das agoes, pois a alta volatilidade poderia significar grandes perdas ou ganhos e, portanto, maior 
incerteza. Em mercados volateis, e dificil para as empresas aumentar o capital nos mercados de 
capitais. 

Como modelar uma serie temporal financeira que pode experimentar tal volatilidade? Por exem¬ 
plo, como modelar a serie temporal dos pregos das agoes, das taxas de cambio, da inflagao etc? Uma 
caracteristica da maioria dessas series temporais financeiras e que na sua forma em mvel elas sao 
passeios aleatorios; isto e, sao nao estacionarias. Por outro lado, na forma de primeira diferenga, 
sao em geral estacionarias, como vimos no caso da serie do PIB, no capftulo anterior, a despeito de o 
PIB nao ser estritamente uma serie temporal financeira. 

Sendo assim, em vez de modelar os niveis da serie temporal financeira, por que nao modelar as 
suas primeiras diferengas? Essas primeiras diferengas frequentemente exibem grandes oscilagoes, 
ou volatilidade, sugerindo que a variancia da serie temporal financeira muda ao longo do tempo. 
Como podemos modelar tal “variancia variavel”? E aqui que o chamado modelo de heterocedas- 
ticidade condicional autorregressiva (ARCH) originalmente desenvolvido por Engle vem a ca- 
lhar. 22 

Como o nome sugere, a heterocedasticidade ou variancia desigual pode ter uma estrutura autor¬ 
regressiva na qual a heterocedasticidade observada ao longo de diferentes perfodos pode ser auto- 
correlacionada. Para melhor entendermos, vamos examinar um exemplo. 


EXEMPLO 22.1 

Taxa de cambio 
dos Estados 
Unidos/Reino 
Unido: um 
exemplo 


A Figura 22.6 fornece os logs da taxa de cambio mensal dos Estados Unidos e do 
Reino Unido (dolares por libra) para o perfodo entre 1971-2007, para um total de 444 
observagoes mensais. Como se pode ver nesta figura, ha consideraveis altos e baixos na 
taxa de cambio ao longo do perfodo da amostra. Na Figura 22.7, tragamos as variagoes 
nos logs da taxa de cambio; perceba que as variagoes no log de uma variavel denota 
mudangas relativas, que, se multiplicadas por 100, oferecem variagoes percentuais. 
Como se pode observar, as variagoes relativas nas taxas de cambio norte-americanas e 
britanicas mostram grandes oscilagoes para alguns perfodos e oscilagoes relativamente 
moderadas em outros perfodos, exemplificando, com isso, o fenomeno da aglomeragao 
por volatilidade. 

( Continua ) 


21 FRANSES, Philip Hans. Time series models for business and economic forecasting. Nova York: Cambridge University 
Press, 1998. p. 155. 

22 ENGLE, R. "Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom 
inflation." Econometrica, v. 50. n. 1, p. 987-1.007, 1982. Veja tambem BERA, A.; HIGGINS, M. "ARCH models: 
properties, estimation and testing." Journal of Economic Surveys, 1993. v. 7, p. 305-366. 
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EXEMPLO 22.1 

( Continuagao ) 

FIGURA 22.6 

Log da taxa de 
cambio dos Estados 
Unidos/Reino 
Unido, 1971-2007 
(mensal). 



FIGURA 22.7 

Variagao no log da 
taxa de cambio dos 
Estados Unidos/ 
Reino Unido. 



Agora, a questao pratica e: como medimos estatisticamente a volatilidade? Vejamos 
nosso exemplo de taxa de cambio. 

Consideremos Y t = taxa de cambio Estados Unidos/Reino Unido 
Y* t = log de Y t 

dY* t = Y\ — Y t_i= variagao relativa na taxa de cambio 
d Y* t = media de dY\ 

X t = dY' t - dY' t 


( Continua ) 
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EXEMPLO 22.1 

(' Continuagdo ) 


Entao, X,ea variagao relativa media ajustada na taxa de cambio. Agora podemos utilizar 
X 2 como uma medida de volatilidade. Sendo uma quantidade quadratica, seu valor sera 
alto quando houver grandes variagoes nos pre^os dos ativos financeiros e seu valor valor 
sera comparativamente pequeno quando houver varia^oes modestas nos pregos dos 
ativos financeiros. 23 

Aceitando X 2 como uma medida de volatilidade, como sabemos se ele varia ao longo 
do tempo? Suponha que consideremos o seguinte modelo AR(1) ou ARIMA (1, 0, 0): 

X t 2 =A)+/3i Xh + ut ( 22 . 10 . 1 ) 


Esse modelo postula que a volatilidade no perfodo atual e relacionada com o seu valor no 
perfodo anterior mais um termo de erro de rufdo branco. Se e positivo, ele sugere que, 
se a volatilidade era alta no perfodo anterior, ele continuara a ser alta no perfodo atual, 
indicando aglomerafao por volatilidade. Se fit for zero, nao havera aglomeragao por vola¬ 
tilidade. A estatfstica significativa do f$ 2 estimado pode ser julgada pelo teste t habitual. 

Nao ha nada que nos impe^a de considerar um modelo de volatilidade AR(p) como 


X 2 - Po + /?1 X 2 . n + P2^t-2 + "' + PpXf-p + u t 


( 22 . 10 . 2 ) 


Esse modelo sugere que a volatilidade no perfodo atual esta relacionada com a dos perfo- 
dos passados p, de modo que o valor de p e uma questao empfrica. Esta pode ser resol- 
vida por um ou mais criterios de selefao de modelo que discutimos no Capftulo 1 3 (por 
exemplo, a medida de informagao Akaike). Podemos testar a significance de qualquer 
coeficiente individual ft pelo teste tea significance coletiva de dois ou mais coeficientes 
pelo teste F habitual. 

O modelo (22.10.1) e um exemplo de modelo ARCH(1) e a Equagao (22.10.2) e 
chamada de modelo ARCH(p), em que p representa o numero de termos autorregressi- 
vos no modelo. 

Antes de continuarmos, vamos ilustrar o modelo ARCH com os dados da taxa de 
cambio dos Estados Unidos/Reino Unido. Os resultados do modelo ARCH(1) estao apre- 
sentados a seguir: 

X 2 = 0,00043 + 0,23036X 2 1 

t= (7,71) (4,97) ( 22 . 10 . 3 ) 

R 2 = 0,0531 d= 1,9933 

em que X 2 e como definimos antes. 

Uma vez que o coeficiente do termo defasado e altamente significativo (o valor p e de 
aproximadamente 0,000), parece que a aglomeragao de volatilidade esta presente na 
instancia em discussao. Tentamos os modelos ARCH de ordem mais elevada, mas apenas 
o modelo AR(1) mostrou-se significativo. 

Como testarfamos o efeito ARCH em um modelo de regressao geral baseado em da¬ 
dos da serie temporal? Para sermos mais especfficos, consideremos o modelo de regres¬ 
sao linear de variavel k: 


Yt - P i + PiX 2 t + ■ ■ ■ + PkXkt + Ut 


( 22 . 10 . 4 ) 


( Continua ) 


23 Voce deve perguntar por que nao utilizamos a variancia de X t = X 2 /r? como uma medida de volatilidade. O 

motivo e que queremos levar em conta a variagao da volatilidade dos pregos dos ativos ao longo do tempo. Se 
utilizarmos a variancia de X t , ela apenas sera um valor unico para determinado conjunto de dados. 
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EXEMPLO 22.1 

( Continuagao ) 


e admitamos que, dependendo da informapao disponfvel no tempo (f — 1), o termo de 
disturbio e distribufdo como 


u t ~ n[o, (a 0 + oqu 2 ^)] ( 22 . 10 . 5 ) 

isto e, u t e normalmente distribufdo com media zero e 

var(ut) = (a 0 + ( 22 . 10 . 6 ) 

isto e, a variancia de u t segue um processo ARCH(1). 

A normalidade de u t nao e novidade para nos. O novo e que a variancia de u no pe- 
rfodo t e dependente do quadrado do disturbio no tempo (f — 1), o que da aparencia de 
correlagao serial. 24 E claro que a variancia do erro pode depender nao apenas de um 
termo defasado do termo de erro quadratico, mas tambem de varios termos quadraticos 
defasados como se segue: 


var(u t )= a 2 = a 0 + oqu 2 1 + a 2 uf_ 2 + ■■■+ ct p u?_ p ( 22 . 10 . 7 ) 

Se nao houver nenhuma autocorrelagao na variancia de erro, temos 

Ho: a^ = oi2 = - - = a p = 0 (22.10.8) 

caso em que var ( u t ) = a 0 , e nao temos o efeito ARCH. 

Uma vez que nao observamos diretamente cr 2 , Engle mostrou que executar a seguin- 
te regressao pode facilmente testar a hipotese nula precedente: 

U( = do + + &2U^_2 h —+ u p uf_ p ( 22 . 10 . 9 ) 

em que u t , como de costume, denota os resfduos MQO obtidos com base no modelo de 
regressao original (22.10.4). 

Pode-se testar a hipotese nula H 0 pelo teste F habitual ou, como alternativa, compu- 
tando nR 2 , em que R 2 e o coeficiente de determinagao a partir da regressao auxiliar 
(22.10.9). Pode-se demonstrar que 


nR L~ 4 ( 22 . 10 . 10 ) 

isto e, em amostras grandes nR 2 segue a distribuigao dos qui-quadrados com graus de 
liberdade igual ao numero de termos autorregressivos na regressao auxiliar. 

Antes de passarmos a ilustragao, vamos nos assegurar de que voce nao confunda a 
autocorrela^ao do termo de erro como discutido no Capftulo 12 com o modelo ARCH. 
No modelo ARCH, e a variancia (condicional) de u t que depende dos termos de erro 
(quadraticos) previos, dando assim a impressao de autocorrelagao. 


Uma observagao tecnica: lembre-se de que, para o nosso modelo linear classico, a variancia de u t f°i admitida 
como a 2 , que, neste contexto, torna-se variancia incondicional. Se oq < 1, a condifao de estabilidade, podemos 
escrever a 2 = a 0 + a^cr 2 ; ou seja, a 2 — a p /t} — iq). Isso demonstra que a variancia incondicional de u nao depen¬ 
de de t, porem depende do parametro ARCH oq. 
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EXEMPLO 22.2 

Variagdes nos 
pregos na bolsa 
de valores de 
Nova York 


Como uma nova ilustragao do efeito ARCH, a Figura 22.8 apresenta uma variagao 
percentual mensal do fndice da Nyse (New York Stock Exchange - Bolsa de Valores de Nova 
York) para o perfodo entre 1966-2002. 25 E evidente, por meio deste grafico, que as varia¬ 
nces de pregos percentuais no fndice Nyse exibem consideravel volatilidade. Perceba, 
principalmente, a ampla oscilagao ao redor da queda nos pregos das agoes em 1987. 

Para capturarmos a volatilidade no retorno de agoes verificada na figura, considere- 
mos um modelo muito simples: 


Y t = P i + u t 


( 22 . 10 . 11 ) 


em que Y t = variagao percentual no fndice NYSE e u t = termo de erro aleatorio. 


FIGURA 22.8 

Variagao percentual 
mensal no fndice de 
pregos da Nyse, 
1966-2002. 



Observe que, alem do intercepto, nao ha outra variavel explanatoria no modelo. Com 
base nos dados, obtivemos a seguinte regressao por MQO: 


Y t = 0,00574 

t = (3,36) ( 22 . 10 . 12 ) 

d= 1,4915 

O que esse intercepto denota? Ele e simplesmente a taxa de retorno percentual media 
do fndice Nyse, ou o valor medio de Y t (voce pode verificar isso?). Ao longo do perfodo da 
amostra, o retorno mensal medio no fndice Nyse foi de aproximadamente 0,00574%. 

Agora obtemos os resfduos por meio da regressao anterior e estimamos o modelo 
ARCH(1), o que nos fornece os seguintes resultados: 


u\= 0,000007+ 0,2540 6uf_, 

t = (0,000) (5,52) ( 22 . 10 . 13 ) 

R 2 = 0,0645 d = 1,9464 

em que u t e o resfduo estimado por meio da regressao (22.10.12). 

Uma vez que o termo de disturbio quadratico defasado e estatisticamente significativo 
(valor p de aproximadamente 0,000), parece que as variancias de erro sao correlaciona- 
das: ha um efeito ARCH. Experimentamos modelos ARCH de ordens mais altas, mas 
apenas o ARCH(1) foi estatisticamente significativo. 


25 Esse grafico e os resultados da regressao apresentados, no exemplo, sao baseados nos dados coletados por KOOP, 
Cary. Analysis of economic data. Nova York: John Wiley e Sons, 2000 (dados do disco de dados). A variagao 
percentual mensal no fndice de pregos de agoes pode ser considerada uma taxa de retorno sobre o fndice. 
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O que fazer se o ARCH estiver presente 

Lembre-se de que discutimos varios metodos de correijao de heterocedasticidade, que basi- 
camente envolvia a aplica§ao dos MQO em dados transformados. Lembre-se de que os MQO 
aplicados a dados transformados sao mfnimos quadrados generalizados (MQG). Se o efeito 
ARCH for descoberto, teremos de utilizar os MQG. Nao nos deteremos nos detalhes tecnicos, 
ja que estao alem do objetivo deste livro. 26 Felizmente, os pacotes de software como o EViews, 
SHAZAM, MICROFIT e PC-GIVE agora possuem rotinas simplificadas para estimar tais mo¬ 
delos. 


Uma palavra sobre o d Durbin-Watson e o efeito ARCH 

Por diversas vezes, temos lembrado o leitor de que uma estatfstica d significativa pode nem 
sempre indicar que ha uma correlafao significativa nos dados em questao. Com frequencia, um 
valor d significativo e uma indicac^ao dos erros de especificafao do modelo que discutimos no 
Capitulo 13. Agora, temos um erro de especificafao adicional, devido ao efeito ARCH. Portanto, 
em uma regressao da serie temporal, se um valor d significativo e obtido, devemos testar o efeito 
ARCH antes de aceitar a estatfstica d em seu valor nominal. Um exemplo e oferecido no Exercfcio 
22.23. 

Uma nota sobre o modelo GARCH 

Desde a sua “descoberta”, em 1982, a modelagem ARCH transformou-se em uma industria em 
crescimento, com todos os tipos de varia 5 des sobre o modelo original. Uma das que se tornaram po- 
pulares e o modelo de heterocedasticidade condicional autorregressiva generalizada (GARCH), 
originalmente proposto por Bollerslev. 27 O modelo GARCH mais simples e o modelo GARCH(1, 1), 
que pode ser escrito assim: 

a 2 = ao + ai m 2 _ j + a 2 a }_, (22.10.14) 

que informa que a variancia condicional de u no periodo t depende nao apenas do termo de erro 
quadratico no periodo de tempo anterior (como em ARCH[1]), mas tambem de sua variancia condi¬ 
cional no periodo de tempo anterior. Esse modelo pode ser generalizado para um modelo GARCHi/j, q) 
no qual ha p termos defasados do termo de erro quadratico e q termos das variancias condicionais 
defasadas. 

Nao prosseguiremos com os detalhes tecnicos desses modelos, por serem complexos, mas sa- 
lientamos apenas que um modelo GARCH(1, 1) e equivalente ao modelo ARCH(2) e um modelo 
GARCH(p, q) e equivalente a um modelo ARCH(/r + q). 2S Para nossos exemplos de taxa de cam- 
bio dos Estados Unidos/Reino Unido e de retorno das a?oes da Nyse, ja estabelecemos que um 
modelo ARCH(2) nao era significativo, sugerindo que, talvez, um modelo GARCH(1, 1) nao seja 
adequado nesses casos. 


22.11 Exemplos finals 

Conclufmos este capitulo considerando uns poucos exemplos adicionais que ilustram alguns dos 
pontos abordados aqui. 


26 Consulte DAVIDSON, Russell; MACKINNON, James G. Estimation and inference in econometrics. Nova York: 
Oxford University Press, 1993, segao 16.4; e GREENE, William El. Econometric analysis. 4. ed. Englewood Cliffs, 
NJ: Prentice Hall, 2000, segao 18.5. 

27 BOLLERSLEV, T. "Generalized autoregressive conditional heteroscedasticity." journal of Econometrics, 1986. v. 
31, p. 307-326. 

28 Para mais detalhes, veja DAVIDSON e MACKINNON, op. cit., p. 558-560. 
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EXEMPLO 22.3 

A relagao entre o 
Indice das 
Condigdes do 
Mercado de 
Trabalho ( HWI) 
e a Taxa de 
Desemprego 
(UN) de janeiro 
de 1969 a janeiro 
de 2000 


Para estudara causalidade entre HWI e UN, dois indicadores das condigoes do mercado 
de trabalho nos Estados Unidos, Marc A. Ciammatteo levou em conta o seguinte modelo 
de regressao: 29 


25 25 

HWI t = a 0 + ^a/UNt-/ + ^0 y HWI t _ y 

/= i i 

(22.11.1) 

25 25 

UN t = ao + 2_/,UN f _/+ 2_,5yHWI t _y 
/=i y=i 

(22.11.2) 


Para economizar esparto, nao apresentaremos os resultados da regressao real, porem a 
principal conclusao que surge desse estudo e a causalidade bilateral entre os dois indicado¬ 
res de mercado de trabalho e essa conclusao nao se modificou quando da varia^ao da ex- 
tensao da defasagem. Os dados HWI e UN sao fornecidos no website do livro, conforme a 
Tabela 22.5. 


EXEMPLO 22.4 

Modelagem 
ARIMA da taxa 
de cambio iene/ 
dolar: de janeiro 
de 1971 a abril 
de 2008 


A taxa de cambio iene/dolar (¥/$) e fundamental. Por meio dos logaritmos da taxa ¥/$ 
mensal, descobriu-se que, em nfvel, ela mostrava um padrao tfpico de uma serie temporal 
nao estacionaria. Contudo, examinando as suas primeiras diferen^as, descobriu-se que 
eram estacionarias: o grafico aqui apresentado e muito semelhante ao da Figura 22.8. 

A analise da raiz unitaria confirmou que as primeiras diferengas dos logs de ¥/$ eram 
estacionarias. Apos examinarmos o correlograma do log das primeiras diferengas, estima- 
mos o seguinte modelo AR(1): 

Y t = - 0,0028- 0,3300u t -i 

t= (-1,71) (-7,32) (22.11.3) 

R 2 = 0,1012 d = 1,9808 

em que Y t = primeiras diferengas dos logs de ¥/$ e u = um termo de erro de rufdo 
branco. 

Para pouparmos espago, fornecemos os dados subjacentes a analise anterior no site do 
livro, na Tabela 22.6. Utilizando esses dados, o leitor e levado a tentar outros modelos e 
comparar seus desempenhos de previsao. 


EXEMPLO 22.5 

Modelo ARCH da 
taxa de inflagao 
norte-americana: 
de janeiro de 1947 
a margo de 2008 


Para verificarmos se o efeito ARCH esta presente na taxa de inflagao norte-americana, 
como mensurada pelo IPC (Indice de Prefos ao Consumidor), obtivemos os dados do 
IPC do perfodo entre janeiro de 1947 a mar^o de 2008. O grafico dos logaritmos do IPC 
demonstrou que a serie temporal era nao estacionaria. Porem, o grafico das primeiras 
diferenfas dos logs do IPC, como mostra a Figura 22.9, demonstra consideravel volatili- 
dade, muito embora as diferengas sejam estacionarias. 

Seguindo o procedimento delineado nas regressoes (22.10.12) e (22.10.1 3), primei- 
ramente fizemos a regressao dos logs das primeiras diferen^as do IPC sobre uma cons- 
tante e obtivemos resfduos por meio dessa equagao. Elevando os resfduos ao quadrado, 
obtivemos o seguinte modelo ARCH(2): 


uf= 0,000028+ 0,12125u, 2 _ 0,08718uf_ 2 

t= (5,42) (3,34) (2,41) 

R 2 = 0,026 d= 2,0214 


(22.11.4) 

( Continua) 


29 CIAMMATTEO, Marc A. (West Point, Class of 2000), "The relationship between the help wanted index and the 
unemployment rate." Artigo de conclusao de curso nao publicado. (Notapoes alteradas para adaptarem-se as 
nossas.) 
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EXEMPLO 22.5 

( Continuagao ) 


FIGURA 22.9 

Primeiras diferengas. 



Ano 

Como se pode ver, ha muita persistence na volatilidade, na medida em que a volati- 
lidade no mes corrente depende da volatilidade nos 2 meses anteriores. Aconselhamos o 
leitor a obter os dados do IPC das fontes governamentais e tentar verificar se outro mo- 
delo, preferencialmente um modelo GARCH, funciona melhor. 


Resumo e 
conclusoes 


1. As abordagens Box-Jenkins e VAR a previsao economica sao altemativas aos modelos de equagao 

simultanea e tinica. 

2. Para prever os valores de uma serie temporal, a estrategia Box-Jenkins basica e a seguinte: 

a. Primeiro, examine a serie para a estacionariedade. Este passo pode ser feito ao calcular a 
fungao de correlagao amostral (ACF) e a fungao de correlagao parcial amostral (PACF) ou 
fazendo uma analise de raiz unitaria. Os correlogramas associados com ACF e PACF sao 
frequentemente boas ferramentas de diagnostico visual. 

b. Se a serie temporal for nao estacionaria, execute a diferenciagao uma ou mais vezes ate atingir 
a estacionariedade. 

c. As ACF e PACF da serie temporal sao, entao, calculadas para descobrir se a serie e puramen- 
te autorregressiva ou puramente do tipo de media movel ou uma mistura das duas. Por meio 
das diretrizes gerais dadas na Tabela 22.1, pode-se determinar os valores de p e q no processo 
ARMA a ser ajustado. Nesse estagio, o modelo escolhido ARMA(p, q) e experimental. 

d. O modelo experimental e, entao, estimado. 

e. Os resfduos desse modelo experimental sao examinados para descobrir se sao de rufdo bran- 
co. Se forem, o modelo experimental sera provavelmente uma boa aproximagao ao processo 
estocastico subjacente. Se nao forem, o processo sera novamente iniciado. Portanto, o meto- 
do Box-Jenkins e iterativo. 

f. Agora, o modelo selecionado pode ser utilizado para a previsao. 

3. A abordagem VAR para a previsao considera varias series temporais isoladamente. As caracterfs- 

ticas distintivas do VAR sao as seguintes: 

a. E um sistema verdadeiramente simultaneo no qual todas as variaveis sao consideradas endo- 
genas. 

b. Na modelagem VAR, o valor de uma variavel e expresso como uma fungao linear dos valores 
do passado ou defasados daquela variavel e todas as variaveis inclufdas no modelo. 
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EXERCICIOS 


c. Se cada equa 9 ao content o mesmo numero de variaveis defasadas no sistema, ela pode ser 
estimada pelos MQO sem Ian car mao de qualquer metodo de sistemas, como os mfnimos 
quadrados de dois estagios (MQ2E) ou regressoes aparentemente nao relacionadas (SURE). 

d. A simplicidade da modelagem VAR pode ser sua desvantagem. Em vista do numero limitado 
de observa 5 oes que, geralmente, estao dispom'veis na maioria das analises economicas, a in- 
trodu 5 ao de varias defasagens pode consumir varios graus de liberdade. 30 

e. Se ha varias defasagens em cada equapao, nem sempre e facil interpretar cada coeficiente, prin- 
cipalmente se os sinais dos coeficientes alternam-se. Por isso, examina-se a fun 9 ao de resposta 
a impulso (IRF) na modelagem VAR para descobrir como a variavel dependente responde ao 
choque administrado a uma ou mais equa 9 oes no sistema. 

f. Ha consideraveis debates e controversias acerca da superioridade dos varios metodos de 
previsao. Os metodos de previsao uniequacional, de equapoes simultaneas, Box-Jenkins e 
VAR contam com seus defensores, bem como com seus detratores. Tudo o que se pode dizer 
e que nao ha um linico metodo que se ajuste a todas as situa 9 oes. Se esse fosse o caso, nao 
haveria necessidade de discutir as varias alternativas. Uma coisa e certa: as metodologias 
Box-Jenkins e VAR tornaram-se parte integrante da econometria. 

4. Consideramos tambem, neste capftulo, uma classe especial de modelos, ARCH e GARCH, que 
sao especialmente titeis na analise das series temporais financeiras, como os prepos das a 9 oes, as 
taxas de inflapao e as taxas de cambio. Uma caracteristica distintiva desses modelos e que a 
variancia de erro pode ser correlacionada ao longo do tempo devido ao fenomeno da aglomera 9 ao 
por volatilidade. A esse respeito, apontamos que, em muitos casos, um d de Durbin-Waton signifi¬ 
cative pode, de fato, dever-se ao efeito ARCH ou GARCH. 

5. Ha variantes dos modelos ARCH e GARCH, mas nao os consideramos neste capftulo em t’uncao 
das limitapoes de espa 90 . Alguns desses outros modelos sao: GARCH-M (GARCH na media), 
TGARCH (limiar do GARCH) e EGARCH (GARCH exponencial). Uma discussao sobre esses 
modelos pode ser encontrada nas references. 31 


22.1. Quais os principals metodos de previsao economica? 

22.2. Quais as principals diferen 9 as entre as abordagens de equa 9 oes simultaneas e Box-Jenkins 
para a previsao economica? 

22.3. Estabele 9 a os principais passos envolvidos na aplica 9 ao da abordagem Box-Jenkins para a 
previsao. 

22.4. O que ocorre se as tecnicas Box-Jenkins sao aplicadas as series temporais estacionarias? 

22.5. Quais as diferen 9 as entre as abordagens Box-Jenkins e VAR para a previsao economica? 

22.6. Em que sentido o VAR e ateorico? 

22.7. “Se o objeto primario e a previsao, o VAR fara o trabalho.” Avalie criticamente essa afirmapao. 

22.8. Posto que o numero de defasagens a ser introduzido em um modelo VAR pode ser uma 
questao subjetiva, como se pode decidir quantas defasagens introduzir em uma aplica 9 ao 
concreta? 

22.9. Comente esta afirma 9 ao: “Box-Jenkins e VAR sao exemplos primordiais de mensura 9 ao 
sem teoria”. 

22.10. Qual a conexao, se houver alguma, entre os testes de causalidade de Granger e a modelagem 
VAR? 


30 Seguidores da estatfstica bayesiana creem que esse problema pode ser minimizado. Veja LITTERMAN, R. "A 
statistical approach to economic forecasting." lournal of Business and Economic Statistics, 1986. v. 4, p. 1 -4. 

31 Veja ENDERS, Waiter. Applied econometric time series. 2. ed. Nova York: John Wiley e Sons, 2004. Para uma dis¬ 
cussao de aplicagao orientada, veja ASTERIOU, Dimitrios; HALL, Stephen. Applied econometrics: a modern approach. 
ed. ver. Nova York: Palgrave/Macmillan, 2007. cap. 14. 
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Exercfcios aplicados 

22.11. Considere os dados de RPD (renda real pessoal disponfvel) introduzidos na Segao 21.1 (veja 
o site do livro para os dados reais). Suponha que voce queira ajustar um modelo ARIMA 
apropriado a esses dados. Delineie os passos envolvidos para que se realize essa tarefa. 

22.12. Repita o Exerclcio 22.11 para os dados DCP (despesas de consumo pessoal reais) introdu¬ 
zidos na Segao 21.1 (veja o site do livro para os dados reais). 

22.13. Repita o Exerclcio 22.11 para o LLC. 

22.14. Repita o Exerclcio 22.11 para o LDividendo. 

22.15. Na Segao 13.9, apresentamos a voce o criterio de Informagao Schwarz (SIC) para determi- 
nar o comprimento da defasagem. Como voce utilizaria esse criterio para determinar o 
comprimento de defasagem adequado em um modelo VAR? 

22.16. Utilizando os dados de RPD e DCP introduzidos na Segao 21.1 (veja o site do livro para os 
dados reais), desenvolva um modelo VAR bivariado para o perlodo 1970-1 a 2006-IV. Use 
esse modelo para prever os valores dessas variaveis para os quatro trimestres de 2007 e 
compare os valores da previsao com os valores reais fornecidos no conjunto de dados. 

22.17. Repita o Exerclcio 22.16, utilizando os dados sobre o LDividendo e o LLC. 

*22.18. Use qualquer pacote estatlstico e estime a fungao de resposta a impulso para um perlodo de 
ate 8 defasagens para o modelo VAR que voce desenvolveu no Exerclcio 22.16. 

22.19. Repita o Exerclcio 22.18 para o modelo VAR que voce desenvolveu no Exerclcio 22.17. 

22.20. Use os resultados da regressao VAR fornecidos na Tabela 22.4. Com base em varios testes 
F relatados nas tres regressoes fornecidas na tabela citada, o que voce pode dizer sobre a 
natureza da causalidade nas tres variaveis? 

22.21. Prosseguindo com o Exerclcio 20.20, voce pode adivinhar por que os autores escolheram 
expressar as tres variaveis no modelo no formato de variagoes, em vez de utilizarem os nlveis 
dessas variaveis? ( Dica: estacionariedade.) 

22.22. Utilizando os dados canadenses fornecidos na Tabela 17.5, descubra se M x e R sao variaveis 
aleatorias estacionarias. Se nao sao, seriam elas cointegradas? Apresente os calculos neces- 
sarios. 

22.23. Continue com os dados da Tabela 17.5. Agora, considere o seguinte modelo simples de 
demanda de moeda no Canada: 

In M\ t = P\ + f $2 lnGDP ( + /I 3 In R t + u t 

a. Como voce interpretaria os parametros deste modelo? 

b. Obtenha os reslduos por meio deste modelo e descubra se ha algum efeito ARCH. 

22.24. Use o modelo ARCH(2) fornecido na Equagao (22.11.4). Utilizando os mesmos dados, es- 
timamos o seguinte modelo ARCH(l): 

£?= 0,00000078 + 0,3737m^_j 

t = (7,5843) (10,2351) 

R 2 = 0,1397 d = 1,9896 

Como voce escolheria entre os dois modelos? Apresente os calculos necessarios. 

22.25. A Tabela 22.7 fornece os dados das taxas das Letras do Tesouro de tres meses e de seis 
meses a partir de l 2 de janeiro de 1982 a margo de 2008, por um total de 315 observagoes 
mensais. Os dados podem ser encontrados no site do livro-texto. 

a. Represente as duas series temporais no mesmo diagrama. O que voce ve? 


Opcional. 
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b. Faya uma analise formal da raiz unitaria para descobrir se essas series temporais sao 
estacionarias. 

c. As duas series temporais sao cointegradas? Como voce sabe disso? Apresente os calcu- 
los necessarios. 

d. Qual o significado economico de cointegragao neste contexto? Se as duas series tempo¬ 
rais nao sao cointegradas, quais as implicayoes economicas? 

e. Se voce quiser estimar um modelo VAR, por exemplo, com quatro defasagens de cada varia- 
vel, teria de utilizar as primeiras diferenyas das duas series ou poderia fazer a analise em 
niveis das duas series? Justifique sua resposta. 

22.26. Exercicio em classe. Escolha um fndice de mercado de ayoes e obtenha dados didrios do 
valor do fndice escolhido por cinco anos para descobrir se o fndice de ayoes e caracterizado 
pelos efeitos ARCH. 

22.27. Exercicio em classe. Colete dados sobre a inflayao e sobre as taxas de desemprego norte- 
-americanas para os perfodos trimestrais em 1980-2007, desenvolva e estime o modelo 
VAR para as duas variaveis. Para calcular a taxa de inflayao, utilize o IPC (indice de preyos 
ao consumidor) e use a taxa de desemprego civil para calcular a taxa de desemprego. Preste 
muita atenyao a estacionariedade dessas variaveis. Alem disso, descubra se uma variavel 
Granger causa a outra variavel. Apresente todos os seus calculos. 


Apendice 

Revisao de alguns 
conceitos estatisticos 



Este apendice fornece uma introdugao bem resumida de alguns dos conceitos estatisticos encon- 
trados no texto. A discusao nao e rigorosa e nenhuma prova e fornecida, porque um grande numero 
de livros excelentes sobre estatistica faz muito bem esse trabalho. Algumas dessas obras estao lista- 
das no final deste apendice. 


A. 1 Operadores somatorio e de produto 

A letra maiuscula grega £ (sigma) e utilizada para indicar somatorio. Assim, 

n 

= Xi + X2 H-1-X„ 

i= 1 

Algumas das propriedades importantes do operador somatorio sao: 

n 

1. k = nk, em que k e constante. Assim, £,•_ j 3 = 4 • 3 = 12. 

i=i 

2 . ]T'' = j kx, = k i x t , em que k e uma constante. 

3. H" = i ( a + bxj) = na + b £' = i x,, em que a e b sao constantes e aplicam-se as propriedades 
1 e 2 anteriores. 

4. £"= i (xj + y,) = £" = i + £',= i y>. 

O operador somatorio tambem pode ser estendido as somas multiplas. Assim, ££, ° operador 
duplo somatorio, e definido como: 

n m n 

y^ y> y>, 1 + x^?+■ * ■ + x (m ) 

i= 1 j= 1 i= 1 

= (Xu + X21 + ’ • ’ + X„i) + (X12 + X22 +-H X„2) 

+ * • ■ + (Xj m + X2m X nm ) 

Algumas das propriedades de ££ sao: 

1 ■ £f= l 11"/= i x ij = £”1 1 £" = i x (/ ; a ordem, na qual o duplo somatorio e executada, e permu- 
tavel. 

2. £,= 1 £,= 1 Xtyj = £, = ! X, £ y= ! . 
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3. 

4. 


Er=i£T=i(*y + yij) = 

[T,"=i x t ] 2 = T,"=i x f + 


E n x~~^m , \—ym 

i— \ E/= i Xi J + E;= i E/= i iVy- 

2Em E?= <+ ,^ = £?=,*? + 2 


O operador produto e definido como 


Assim, 


n 

^ Xi = X\ ■ X2 • • • X n 
i= 1 


3 

~[ Xi = X 1 • x 2 • x 3 
i= 1 


A.2 Espa^o amostral, pontos amostrais e eventos 

O conjunto de todos os resultados possfveis de um experimento aleatorio, ou ao acaso, e chamado 
popula^ao, ou espago amostral, e cada membro desse espa 50 amostral e chamado de ponto amos¬ 
tral. No experimento de lan 5 ar duas moedas, o espa 50 amostral consiste nesses possfveis quatro resul¬ 
tados: HH, HT, TH e 7T, em que HH significa cara no primeiro I an 9 am en to e coroa no segundo e assim 
por diante. Cada uma das ocorrencias anteriores constitui um ponto amostral. 

Um evento e um subconjunto do espago amostral. Se denotarmos A a ocorrencia de uma cara 
e de uma coroa, entao, dos possfveis resultados anteriores, apenas dois pertencem a A, ou seja, HT 
e TH. Nesse caso, A constitui um evento. Da mesma maneira, a ocorrencia de duas caras em um 
lan§amento de duas moedas e um evento. Diz-se que eventos sao mutuamente exclusivos se a 
ocorrencia de um eliminar a ocorrencia do outro. Se, no exemplo anterior, ocorre HH, a ocorrencia 
do evento HT ao mesmo tempo nao e possfvel. Diz-se que eventos sao (coletivamente) exaustivos 
se exaurem todas os possfveis resultados de um experimento. No exemplo, os eventos (a) duas 
caras, (b) duas coroas e (c) uma coroa, uma cara exaure todos os resultados; daf eles serem even¬ 
tos (coletivamente) exaustivos. 


A. 3 Probabilidade e variaveis aleatorias 


Probabilidade 

Seja A um evento em um espaco amostral. Por P(A), a probabilidade do evento A, entendemos a 
proporcao de vezes que o evento A ocorrera em repetidas tentativas de um experimento. Como alter- 
nativa, em um total de n possfveis resultados igualmente provaveis de um experimento, se m deles 
sao favoraveis a ocorrencia do evento A, definimos a razao ni/n como a frequencia relativa de A. 
Para valores maiores de n, essa frequencia relativa fornecera uma aproximayao bastante boa da pro¬ 
babilidade de A. 

Propriedades da probabilidade 

P(A) e uma fun 9 ao de valor real 1 e possui essas propriedades: 

1. 0 < P(A) < 1 para cada A. 

2. Se A, B, C,.. . constituem um conjunto exaustivo de eventos, P( A + B + C + ■■■) = 1, em 
que A + B + C significa A ou B ou C e assim por diante. 


1 Uma funfao cujo dorrnnio e alcance sao subconjuntos de numeros reais e comumente referida como fungao de 
valor real. Para mais detalhes, veja CHIANG, Alpha C. Fundamental methods of mathematical economics. 3. ed. 
Nova York: McGraw-Hill, 1984. cap. 2. 
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3. Se A, B, C, .. . sao eventos mutuamente exclusivos, 

P(A + B + C + • ■ • ) = P(A) + P{B) + P(C ) + ■ ■ ■ 

EXEMPLO 1 

Considere o experimento de langar um dado numerado de 1 a 6. O espa^o amostral 
consiste nos resultados 1, 2, 3, 4, 5 e 6. Os seis eventos, portanto, exaurem totalmente o 
espago amostral. A probabilidade de qualquer um desses numeros aparecer e de 1/6, uma 
vez que ha seis resultados igualmente provaveis e qualquer um deles possui uma chance igual 
de acontecer. Na medida em que 1,2, 3, 4, 5 e 6 formam um conjunto exaustivo de eventos, 

P ( 1 + 2 + 3 + 4 + 5 + 6) = 1 em que 1, 2, 3... indica a probabilidade do numero 1 ou do 
numero 2 ou do numero 3 etc. E, na medida em que 1, 2, ..., 6 sao eventos mutuamente 
exclusivos no sentido de que dois numeros nao podem ocorrer simultaneamente, P( 1 + 2 + 

3 + 4 + 5 +6) = P (1)4- P (2) + • • • + P (6) = 1. 


Variaveis aleatorias 

Uma variavel cujo valor e determinado pelo resultado de um experimento aleatorio e chamada de 
variavel aleatoria. As variaveis aleatorias sao normalmente denotadas pelas letras maiusculas X, Y, 
Z etc., e os valores assumidos por elas sao indicados pelas letras minusculas x, y, z etc. 

Uma variavel aleatoria pode ser tanto discreta como contmua. Uma variavel aleatoria discreta 
pode assumir apenas um numero finito (ou infinite enumeravel) de valores . 2 Por exemplo, ao lancar- 
mos dois dados, cada um com numeros de 1 a 6 , se definirmos a variavel aleatoria X como a soma dos 
numeros mostrados nos dois dados, X tera um desses valores: 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11 ou 12. Por¬ 
tanto, e uma variavel aleatoria discreta. Uma variavel aleatoria contmua, por outro lado, e aquela que 
pode assumir qualquer valor em algum intervalo dos valores. A altura de um indivfduo e uma variavel 
contmua — em uma amplitude de, por exemplo, 60 a 65 polegadas, ele pode ter qualquer valor, de- 
pendendo da precisao da medi§ao. 


A.4 Fun^ao de densidade de probabilidade (FDP) 



Fun^ao de densidade de probabilidade de uma variavel aleatoria 
discreta 

Seja X uma variavel aleatoria discreta que toma valores distintos x\, x 2 ,..., x,„... Entao, a fun 5 ao 

f(x) = P{X = Xi) para i = 1, 2,. 

= 0 para x ^ x, 

e chamada funtjao de densidade de probabilidade discreta (FDP) de X, em que P (X — x,) significa 
a probabilidade de que a variavel aleatoria discreta X tome o valor de x,. 

EXEMPLO 2 

Ao lan^arem dois dados, a variavel aleatoria X, a soma dos numeros apresentados nos dois 
dados, pode assumir um dos 11 valores exibidos. A FDP dessa variavel pode ser representada 
como se segue (Veja tambem a Figura A.1): 

x= 2 3 4 5 6 7 8 9 10 11 12 

f(X) ~ (j«)(3«)(36)(36)(36)(36)(36)(36)(36)(36)(36) 

( Continua ) 


2 Para uma discussao simples da nogao de conjuntos infinites enumeraveis, veja ALLEN, R. G. D. Basic mathematics. 
Londres: Macmillan, 1964. p. 104. 
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EXEMPLO 2 

(' Continuagdo) 


Essas probabilidades podem ser facilmente verificadas. Em todas, ha 36 resultados possfveis, 
dos quais um e favoravel ao numero 2, dois sao favoraveis ao numero 3 (uma vez que a soma 
3 pode ocorrer tanto no caso de 1 no primeiro dado, como com 2 no segundo dado ou com 
2 no primeiro dado e 1 no segundo dado), e assim por diante. 

FIGURAA.1 Funjao de densidade da variavel aleatoria discreta do Exemplo 2. 


m 



Fungao de densidade de probabilidade de uma variavel aleatoria 
contmua 

Seja X uma variavel aleatoria contfnua. Entao, f(x) sera a l u 119 ao de densidade de probabilidade 
de X se as seguintes condipoes forem satisfeitas: 


/« ^ 0 



1 



dx = P(a < x < b) 


em que / (x) dx e conhecido como o elemento da probabilidade (a probabilidade associada a um 
pequeno intervalo de uma variavel contfnua) e P(a < x < b) indica a probabilidade de que X situe-se 
no intervalo entre a e b. Geometricamente, temos a Figura A.2. 

Para uma variavel aleatoria contfnua, em contraste com uma variavel aleatoria discreta, a probabi¬ 
lidade de que X assuma um valor especifico e zero ; 3 a probabilidade de tal variavel e mensurada 
apenas para uma dada amplitude, ou intervalo, tal como (a, b), representado na Figura A.2. 


EXEMPLO 3 Considere a seguinte fun^ao de densidade: 

fix ) = -x 2 0 < x < 3 

v ' 9 

Pode ser prontamente verificado que f(x) > 0 para todos os x no intervalo de 0 a 3 e que 
/ 0 3 \x 2 dx = 1. ( Nota : a integral e ( 27 X 3 |g) = 1.) Se quisermos avaliar a fun^ao de densidade de 
probabilidade anterior entre, por exemplo, 0 e 1 , obtemos 1 x 2 dx = ( 27 X 3 |J) = A; ou seja, 
a probabilidade de que x situa-se entre 0 e 1 e 1 /27. 
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FIGURA A.2 

Fungao de densidade 
de uma variavel 
aleatoria contmua. 



Fun0es de densidade de probabilidade conjunta 

Fungdo de densidade de probabilidade conjunta discreta 
Sejam X e Y duas variaveis aleatorias discretas. Entao, a fungao 


f(x,y)= P{X= xe Y=y) 

= 0 onde I/ie Y / y 


e conhecida como funcao de densidade de probabilidade conjunta discreta e fornece a probabili¬ 
dade (conjunta) de que X tome o valor de x e Y tome o valor de v. 


EXEMPLO 4 A seguinte tabela oferece a funcao de densidade de probabilidade conjunta das variaveis 

discretas X e Y: 


X 

-2 0 2 3 

3 0,27 0,08 0,16 0 

Y 

6 0 0,04 0,10 0,35 


Essa tabela mostra que a probabilidade de que X tome o valor de —2 enquanto Y simul- 
taneamente assume o valor de 3 e de 0,27 e que a probabilidade de que X toma o valor de 
3 enquanto Y toma o valor de 6 e de 0,35 e assim por diante. 


Funcao de densidade de probabilidade marginal 

Em rela 5 ao a f(x, y),f{x) e / (v) sao chamadas de fu^oes de densidade individual ou margi¬ 
nal, as fungoes de densidade de probabilidade. Essas fun goes de densidade de probabilidade mar¬ 
ginal sao derivadas como se segue: 

/ (x) = f(x,y) FDP marginal de X 

y 

f(y) = ^ /(x, y) FDP marginal de Y 

X 


em que, por exemplo, 2_, y significa a soma de todos os valores de Y e a soma de todos os valores 

de X. 
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EXEMPLO 5 


Considere os dados fornecidos no Exemplo 4. A fungao de densidade de probabilidade 
marginal e obtida como se segue: 


f(x = - 2)=J2 y> 

y 

t(x = o )=J2 f ( x ' y> 

y 

f(x = 2) = J2 f(K y) 

Y 

f(x = 3) = J2 fix, y ) 


0,27+ 0= 0,27 
0,08+ 0,04 = 0,12 
0,16+ 0,10 = 0,26 
0+ 0,35 = 0,35 


Y 

De forma semelhante, a fungao de densidade de probabilidade marginal de 
como: 


Y e obtida 


f(y= 3 )=J2 

X 

f(y= 6 )=J2 f ( x ' y) 


0,27+ 0,08+ 0,16+ 0= 0,51 
0+ 0,04+ 0,10+ 0,35 = 0,49 


Como esse exemplo demonstra, para obter uma fun^ao de densidade de probabilidade mar¬ 
ginal de X, adicionamos os numeros da coluna, e, para obter a fungao de densidade de pro¬ 
babilidade marginal de Y, adicionamos os numeros das linhas. Perceba que J2x P 1 - 16 cobre 
todos os valores de X e 1, assim como Yl, y f(y) que cobre todos os valores de Y (por que?). 


Fungao de densidade de probabilidade condicional 

Como observado no Capftulo 2, na analise de regressao, frequentemente estamos interessados no 
estudo do comportamento de uma variavel condicional com rela 5 ao ao(s) valor(es) de outra(s) 
variavel(is). Isso pode ser feito considerando a fun 5 ao de densidade de probabilidade condicional. A 
fun9ao 


fix | y) = P(X = x\Y = y) 

e conhecida como fungao de densidade de probabilidade condicional de X; ela apresenta a proba¬ 
bilidade de que X assuma o valor de x posto que Y assumiu o valor de y. De forma semelhante, 

f{y\x)= P(Y = y\X = x) 

que apresenta a POP condicional de Y. 

As fungoes de densidade de probabilidade condicionais podem ser obtidas como se segue: 

fix | 30 

/O'I*) 

Como as expressoes anteriores demonstram, a fungao de densidade de probabilidade condicional 
de uma variavel pode ser expressa como a razao da fungao de densidade de probabilidade conjunta a 
fungao de densidade de probabilidade marginal de outra variavel (condicionante). 


m 

fjx.y) 

fix) 


FDP condicional de X 


FDP condicional de Y 
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EXEMPLO 6 Continuando com os Exemplos 4 e 5, calculemos as seguintes probabilidades condi- 

cionais: 

f(X=-2\Y = 3) = f(X = f ~ \ 3) = 0,27/0,51 = 0,53 

Perceba que a probabilidade incondicional f ( X = —2) e 0,27, mas se Y assumiu o valor de 
3, a probabilidade de que X tome o valor de -2 e de 0,53. 

f (X = 21 Y = 6 ) = f(X " 2 ' Y 7 6) = 0,10/0,49 = 0,20 
f(Y = 6) 

Novamente, note que a probabilidade incondicional de que X tome o valor de 2 e de 0,26, 
o que e diferente de 0,20, que e o seu valor se Y assume o valor de 6 . 


Independence estatfstica 

As duas variaveis aleatorias X e Y sao estatisticamente independentes se, e somente se, 

f(x,y) = /CO/O') 

ou seja, se a fungao de densidade de probabilidade conjunta puder ser expressa como o produto das 
fur^oes de densidade de probabilidade marginais. 


EXEMPLO 7 Uma bolsa contem tres bolas numeradas 1,2 e 3. Duas bolas sao retiradas aleatoriamente, 

com reposi<;ao, dessa bolsa (a primeira bola retirada e recolocada antes que a segunda seja 
retirada). Seja X o numero da primeira bola retirada e Y o numero da segunda bola retirada. 
A seguinte tabela apresenta a FDP conjunta de X e Y. 


X 

1 2 3 

111 
9 9 9 

111 
9 9 9 

111 
9 9 9 


Agora, f(X = 1,7= 1)= f(X = 1)= 5 (obtidopelasomadaprimeiracoluna)e f(y = 1 ) = 1 
(obtido pela soma da primeira linha). Uma vez que f ( X, Y) = f(X)f(7) neste exemplo, 
podemos dizer que as duas variaveis sao estatisticamente independentes. Pode ser facilmen- 
te verificado que, para qualquer outra combinagao de valores X e Y dados nessa tabela, a 
fun^ao de densidade de probabilidade conjunta pode ser representada como o produto das 
fun^oes de densidade de probabilidade individuals. 

Pode-se demonstrar que as variaveis X e Y do Exemplo 4 nao sao estatisticamente inde¬ 
pendentes, na medida em que o produto das duas fun^oes de densidade de probabilidade 
marginal nao e igual a fungao de densidade de probabilidade conjunta. ( Nota: f ( X, Y) = 
f(X)f(Y) deve ser verdadeiro para todas as combina^oes de X e Y para que as duas variaveis 
sejam estatisticamente independentes). 


1 

Y 2 
3 
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Fungao de densidade de probabilidade conjunta contmua 

A fun 5 ao de densidade de probabilidade/(x, y) de duas variaveis contfnuas X e Ye tal que 


f(x,y) > 0 
f f f(x,y)dxdy= 1 

J —oo J —oo 


d pb 


If 


f(x, y) dx dy = P(a <x<b,c<y<d) 


EXEMPLO 8 Considere a seguinte fungao de densidade de probabilidade 

f(x, y) = 2 - x - y 0<x<1;0</<1 
E obvio que f(x, y) > 0. Alem do mais 4 , 

f f (2 - x - y) dx dy = 1 
Jo Jo 

A fungao de densidade de probabilidade marginal de X e Y pode ser obtida como 
f(x) = J f(x, y) dy FDP marginal de X 

f(y) = i: f(x, y)dx FDP marginal de Y 


EXEMPLO 9 

As duas fun^oes de densidade de probabilidade marginais da fungao de densidade de proba¬ 
bilidade conjunta dadas no Exemplo 8 sao as seguintes: 


f(x)= f f(x, y)dy = 
Jo 

f\ 2-x- y)dy 


X 

1 

>< 

1 

VI 

>< 

VI 

o 

>< 

1 

m |(N 

II 

I— o 



( Continua ) 


4 



A expressao (jY~ y 2 )2) |J significa que a expressao entre parenteses deve ser avaliada com o iimite superior de 
1 e o Iimite inferior de 0; o ultimo valor e subtrafdo pelo primeiro para obter o valor da integral. No exemplo 
anterior, os limites sao (| - j)emy= 1 e 0 perfazendo o valor da integral igualal. 
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EXEMPLO 9 

( Continuagao ) 


Para verificarmos se as duas variaveis do Exemplo 8 sao estatisticamente independentes, pre- 
cisamos descobrir se f{x, y) = f(x)f(y). Uma vez que (2 - x - y) ± (§ - x)(§ - y), podemos 
dizer que as duas variaveis nao sao estatisticamente independentes. 


-f 


f(y) = (2 - x - y)dx 


( 2 '-v-y) 


0 < y < 1 


A.5 As caracterfsticas das distribui^des de probabilidade 

Uma distribuinao de probabilidade pode, com frequencia, ser resumida em termos de algumas 
poucas caracterfsticas, conhecidas como momentos da distribui§ao. Dois dos momentos mais ampla- 
mente utilizados sao a media, ou valor esperado, e a variancia. 

Valor esperado 

O valor esperado de uma variavel aleatoria discreta X, denotado por E(X ), e definido como: 

E(X)= £xf(x) 


em que significa a soma que inclui todos os valores de X ef(x) e a fun 9 ao de densidade de probabili¬ 
dade discreta de X. 


EXEMPLO 10 Considere a distribuigao da probabilidade da soma de dois numeros no langamento dos 

dois dados apresentados no Exemplo 2. (Veja a Figura A.1.) Multiplicando os varios valores X 
la apresentados por suas probabilidades e fazendo a soma geral de todas as observances, 
obtemos: 

f«=^)+3(|) + 4 (|) + - + 12(&) 

= 7 

que e o valor medio da soma dos numeros observados no lanfamento dos dois dados. 


EXEMPLO 11 Estime F(X) e E(Y) para os dados apresentados no Exemplo 4. Vimos que 

x -2 0 2 3 

f(x) 0.27 0,12 0,26 0.35 

Portanto, 

£(X)= £xf(x) 

= (- 2)(0,27) + (0)(0.12) + (2)(0,26) + (3)(0,35) 

= 1,03 

( Continua ) 
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EXEMPLO 11 De forma semelhante, 

( Continuagdo) 


y 3 6 

f(y) 0,51 0,49 

e(y)= 

y 

= (3)(0,51)+ (6)(0,49) 
= 4,47 


O valor esperado de uma variavel aleatoria contfnua e definido como: 

E(X) = /: xf(x)dx 

A unica diferen^a entre esse caso e o valor esperado de uma variavel aleatoria discreta e que 
substitufmos o sfmbolo do somatorio pelo sfmbolo da integral. 


EXEMPLO 12 Vamos descobrir o valor esperado da funfao de densidade de probabilidade contfnua 

apresentada no Exemplo 3. 



_ 9 
- 4 
= 2,25 


Propriedades dos valores esperados 

1. O valor esperado de uma constante e a propria constante. Se b e uma constante, E(b) — b\ 

2. Se a e b sao constantes, 


E(aX+ b) = aE(X) + b 

Isso pode ser generalizado. Se X h X 2 ,... ,X N sao N variaveis aleatorias e a h a 2 ,. . . , a N c h 
sao constantes, entao 

E(ci\X\ + a 2 X 2 + ■ • • + a^Xjg + = u\E(^X\') + cl 2 E{^X 2 ) + • ■ • + E^Xjg') + b 

3. Se X e Y sao variaveis aleatorias independentes, entao 
E(XY) = E(X)E(Y) 


Ou seja, a expectativa do produto XY e o produto das expectativas (individuals) de X e Y. 
Entretanto, observe que 


E 



* 


E(X) 
E(Y ) 


mesmo se X e Y forem independentes; 
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EXEMPLO 13 


Se X e uma variavel aleatoria com funyao de densidade de probabilidade / (x) e se g (x) e 
qualquer fun 5 ao de X, entao 

E[g(X)\ = J]g(Z)/(x) 

X 

se X for discreta 

= J g(X)f(x)dx 

se X for continua 

Assim, se g(X) = X 2 , 


E(X 2 ) = J]x 2 /(A) 

X 

se X for discreta 

= f x 2 f(X)dx 

seXfor continua 


Considere a seguinte fungao de densidade de probabilidade (FDP): 


x 

m 


-2 1 


8 8 8 


Entao, 


£(X)=-2(|) + l(l) + 2(|) 

_ _ 5 
8 


£(X 2 ) = 4(f) + l(l) + 4(|) 

- 29 
“ 8 


Variancia 

Seja X uma variavel aleatoria e seja E{X) = /i. A distribui£ao, ou dispersao, dos valores de X em 
tomo do valor esperado pode ser mensurada pela variancia, definida como 

var(X) = erf = E(X — /x) 2 


A raiz quadrada positiva de erf, o x e definida como desvio padrao de X. A variancia, ou desvio 
padrao, indica quao proximos ou distantes os valores individuals de X estao distribmdos em torno de 
seu valor medio. 

A variancia definida previamente e calculada como se segue: 


var(X) 


n) 2 f{x) 



li) 2 f(x) dx 


se X for uma variavel aleatoria discreta 

se X for uma variavel aleatoria continua 


Para conveniencia de calculo, a formula da variancia apresentada pode ser expressa como 

var(A) = erf = E(X - /x) 2 
= E(X 2 ) - /x 2 
= E(X 2 ) - [E{X)f 
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Aplicando essa formula, podemos verificar que a variancia da variavel aleatoria apresentada no 
Exemplo 13 e ?? - (- |) 2 = 2 ® 7 = 3,23. 

EXEMPLO 14 

Vamos descobrir a variancia da variavel aleatoria apresentada no Exemplo 3. 

var(X) = E (X 2 ) - [£(X)] 2 

Agora 

*•(?)* 

-J[t* 

1 p 5 i 3 

“ 9 LtJo 

= 243/45 

= 27/5 

Uma vez que f (X) = | (veja o Exemplo 12), finalmente temos 

var(X) = 243/45- (f) 2 
= 243/720 = 0,34 


Propriedades da variancia 

1. E(X - 11 ) ’ = E(X 2 ) - ji 1 , como observado anteriormcntc. 

2. A variancia de uma constante e zero. 

3. Se a e b sao constantes, entao 

var (aX + b) = a 2 var (X) 

4. Se X e Y sao variaveis aleatorias independentes, entao 

var (X + Y) = var (A) + var (7) 

var (A- 7) = var (A) + var (7) 

Isso pode ser generalizado para mais do que duas variaveis independentes. 

5. Se A e 7 sao variaveis aleatorias independentes , e ae b sao constantes, 

var (aA + bY) = a 2 var (A) + b 2 var (7) 

Covariancia 

Seja A e 7 duas variaveis aleatorias com medias )ix e puy, respectivamente. Entao, a covariancia 
entre as duas variaveis e definida como: 

cov(A, 7) = E{(X- /x,-)(7- My)} = E(XY) - m*M.v 

E prontamente verificado que a variancia de uma variavel e a covariancia daquela variavel com 
ela mesma. 
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EXEMPLO 15 


A covariancia e calculada como se segue: 

cov (X, Y) = ££< x - Vx)(Y- (i y )f(x, y) 

y x 

= EE XYf(x, y ) - fixUy 

y x 


seXeY sao variaveis aleatorias discretas, e 


cov (A, Y) = 



{X- ii x ){Y - iiy)f(x, y) dxdy 
XYf(x, y) dx dy - ji x jx v 


seXeY sao variaveis aleatorias continuas. 

Propriedades da covariancia 

1. SeXe7 sao independentes, a sua covariancia e zero, pois 
cov (X, Y) = E(XY ) - iixiiy 

= iXxl^y ~ ix x iiy uma vez que E{XY ) = E(X)E(Y) = pL x P y 

quando X e Y sao independentes 


2 . 


cov (a + bX, c + dY) = bd cov(JT, Y) 


em que a, b, c e d sao constantes. 


Vamos descobrir a covariancia entre as variaveis aleatorias discretas X e Y cuja fungao de 
densidade de probabilidade conjunta e como demonstrado no Exemplo 4. Com base no Exem- 
plo 11, ja sabemos que p x = E (X) = 1,03 e que /j, y = E(Y) = 4,47. 


E(XY)=J2J2 XYf ( x ' K> 

= (-2)(3)(0,27)+ (0)(3)(0,08) + (2)(3)(0,16) + (3)(3)(0) 

+ (-2)(6)(0)+ (0)(6)(0,04)+ (2)(6)(0,10)+ (3)(6)(0,35) 
= 6,84 


Portanto, 


cov(X, Y) = E(XY)-nxELy 

= 6,84-(1,03)(4,47) 
= 2,24 


Coeficiente de correla^ao 

O coeficiente de correlagao (populagao) p (rho) e definido como: 


P = 


cov (X, Y) 
y /{var (X) var (7)} 


cov (X, Y) 
a x cfy 
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Assim definido, p e uma medida de associagao linear entre duas variaveis e situa-se entre — 1 e 
+ 1,-1 indicando associagao negativa perfeita e indicando associagao positiva perfeita. 

Por meio da formula anterior, pode-se verificar que 

cov(X, Y) = pcr x <J y 


EXEMPLO 16 Vamos estimar o coeficiente da correlagao para os dados do Exemplo 4. Com base nas 

fungoes de densidade de probabilidade apresentadas no Exemplo 11, pode-se facilmente 
demonstrar que a x = 2,05 e a y = 1,50. Ja mostramos que cov (X, Y) = 2,24. Portanto, apli- 
cando a formula anterior, estimamos que p e 2,24/( 2,05)(1,50) = 0,73. 


Variancias de variaveis correlacionadas 
Sejam X e Y as duas variaveis aleatorias. Entao, 

var(X + Y) = var (20 + var (7) + 2 cov (A, Y) 

= var (20 + var(y) + 2 pa x a y 

var (X - Y) = var (20 + var ( Y) - 2cov(X, Y) 

= var(2Q + var(7) - 2pa x a y 


Entretanto, se X e Y forem independentes, a cov ( X, Y) e zero, neste caso a var ( X + Y) e a 
var (X — Y) sao ambas iguais a var (X) + var (7), como anteriormente observado. 

Os resultados anteriores podem ser generalizados como se segue: Y^= \ = X\ + Xn+ - E X„, 

entao a variancia da combinagao linear X, e 

varf J = var X, + 2 ^ cov (A,, Xj ) 

\<=1 / i= 1 i<j 

n 

= X^var Xt + 2]TJ> W 

i= 1 i < j 

em que p,- ; e o coeficiente de correlagao entre Xj e X ; e cr, e a l sao os desvios padrao de X, e Xj. 

Assim, 

var(2fi + X 2 + Xt,) = var X\ + var X 2 + varX 3 + 2cov(2fi, X 2 ) 

+ 2cov(Ai, X 2 ) + 2cov(X 2 ,X 3 ) 

= vaxX\ + var X 2 + var X 3 + 2pi 2 aicr2 
+ 2p\ 3 o\o 3 + 2p 23 o 2 o 3 


em que a 2 e cr 3 sao, respectivamente, os desvios padrao de X b X 2 e X 3 e p n e o coeficiente de cor¬ 
relagao entre X, e X 2 , Pi 3 que entre X, e X 3 e p 23 que entre X 2 e X 3 . 

Expectativa condicional e variancia condicional 

Seja/(x, v) a FDP conjunta das variaveis aleatorias X e Y. A expectativa condicional de X, dado 
Y — y, e definida como 


e(x\y= v)= J2 x f( x \ Y = y) 

X 

= J x f( x I Y = y)dx 


se X for discreta 

se X for continua 
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EXEMPLO 17 


em que E(X = Y = y) representa a expectativa condicional de X dado Y — y em que/(x I Y — y) 
e a FDP condicional de X. A expectativa condicional de Y, E(Y I X = x), e definida de forma 
semelhante. 


Expectativa condicional 

Observe que E(X I Y) e uma variavel aleatoria, porque ela e uma fun 5 ao da variavel condicionan- 
te Y. Contudo, E(X I Y = y), em que v e um valor especifico de Y, e uma constante. 


Variancia condicional 

A variancia condicional de X dado Y — y e definida como: 
var (X | Y = y) = E{[X - E(X\Y = y)f \Y = y] 

= J2l x ~ E ( x I Y = y)ff( x I Y= y) se X for discreta 

X 

= /_ [Z- £(X| I- = vim, | r = V)* se Xfor continua 


Calcule E (Y \ X = 2) e a var (Y \ X = 2) para os dados do Exemplo 4. 

e(y \ x = 2 ) = J2y f ( y = H X = 2 ) 

= 3f(K = 3 | X = 2)+ 6f(Y = 61 X = 2) 

= 3(0,16/0,26) + 6(0,10/0,26) 

= 4,15 

Nota: f(Y = 3 | X = 2) = f(/= 3, X = 2)/f(X= 2) = 0,16/0,26 e f(f= 6 | X = 2) = f(f= 6, 
X = 2)/ f(X = 2) = 0,10/0,26, entao 

var(7 | X = 2) = E(Y \ X = 2)] 2 f(Y\ X = 2) 

y 

= (3- 4.15) 2 (0.16/0.26)+ (6- 4,15) 2 (0,10/0,26) 

= 2.13 


Propriedades da expectativa condicional e da variancia condicional 

1. Se /'(X j for uma fungao de X, entao E(f(X) I X) — f(X ), isto e, a fun 5 ao de X comporta-se 
como uma constante no calculo de sua expectativa condicional sobre X. Assim, [£,’(X ! I X)] 
= E(X 3 )-, se X for conhecido, X 3 tambem sera. 

2. Se/(X) e g(X) sao funcoes de X, entao 

E[f{X)Y + g(X) | X] = f(X)E(Y | X) + g(X) 

Por exemplo, £[X7 + cX 2 | X] = XE(Y \ X) + cX 2 , em que c e uma constante. 

3. Se X e Y forem independentes, E( Y I X) = E( Y). Ou seja, se X e Y sao variaveis aleatorias 
independentes, a expectativa condicional de Y, dado X, e a mesma que a expectativa incon- 
dicional de Y. 
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4. Lei das expectativas iteradas. E interessante notar a seguinte rela^ao entre a expectativa 
incondicional de uma variavel aleatoria E, E(Y), e sua expectativa condicional baseada em 
outra variavel aleatoria X, E(Y I X): 

E(Y)= E x [E(Y\X)] 

Essa relagao e conhecida como lei das expectativas iteradas, que, neste contexto, estabelece 
que a expectativa marginal, ou incondicional, de be igual a expectativa de sua expectativa 
condicional, na qual o sfmbolo E x denota que a expectativa esta cobrindo os valores de X. 
Simplificando, essa lei estabelece que, se, primeiramente, obtemos E(Y I X) como uma fun- 
£ao de X e tomamos seu valor esperado para a distribu^ao de valores X, terminamos obten- 
do E(Y), a expectativa incondicional de Y. O leitor pode verificar isso, utilizando os dados 
fornecidos no Exemplo 4. 

Uma implica 5 ao da lei de expectativas iteradas e que, se a media condicional de Y dado X 
( E[Y I X]) for zero, a media (incondicional) de Y tambem sera zero. Isso acontece, porque, 
neste caso, 

E[E{Y\X )] = £■[()] = 0 

5. Se X e Y sao independentes, var (EI X) = var (E); 

6. var (E) = £[var ( E I X)] + var [£( E I X)]; isto e, a variancia (incondional) de E e igual a 
expectativa da variancia condicional de E mais a variancia da expectativa condicional de E. 

Momentos de ordem superior das distributes de probabilidade 

Embora a media, a variancia e a covariancia sejam as medidas-resumo mais frequentemente uti- 
lizadas nas FDP univariadas e multivariadas, por vezes precisamos considerar os momentos de ordem 
superior das FDP, como os momentos de terceira e de quarta ordem. Os momentos de terceira e quar- 
ta ordem de uma FDP univariada /'Ot) em torno de seu valor medio (ji) sao definidos como 

Terceiro momento: E(X-/x) 3 

Quarto momento: E{X - /x) 4 

Em geral, o momento de ordem r em torno da media e definido como 

Momento de ordem r: E{X - ii) r 

O terceiro e quarto momentos de uma distribui§ao sao normalmente utilizados no estudo da “for¬ 
ma” de uma probabilidade, em particular, da sua assimetria, S (falta de simetria) e curtose, K (ele- 
va 5 ao ou achatamento), como apresentado na Figura A.3. 

Uma medida de assimetria e definida como: 

s= E(X- M ) 3 
cr 3 

terceiro momento em tomo da media 
cubo do desvio padrao 

Uma medida comumente utilizada de curtose e dada por: 

K= E(X- m) 4 
[E(X- nYY 

quarto momento em torno da media 


quadrado do segundo momento 
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As FDP com valor de K menores de 3 sao chamadas platicurticas (gordas ou de caudas curtas) e 
aquelas com valores maiores de 3 sao chamadas leptocurticas (magras ou de caudas longas). Veja a 
Figura A.3. Uma FDP com um valor curtose de 3 e conhecida como mesocurtica, e desta a distribui¬ 
gao normal e o principal exemplo. (Veja a discussao da distribuigao normal na Segao A.6.) 

Mostraremos, de forma sucinta, como as medidas de assimetria e curtose podem ser combinadas 
para determinar se uma variavel aleatoria segue uma distribuigao normal. Lembremos que o procedi- 
mento de teste da hipotese, como nos testes t e F, e baseado na hipotese (ao menos para as amostras 
pequenas e finitas) de que a distribuigao subjacente da variavel (ou estatistica da amostra) e normal. 
E, portanto, muito importante descobrir nas aplicagoes concretas se essa hipotese e cumprida. 

A. 6 Algumas distribui^oes de probabilidade teoricas importantes 

No livro, e feito amplo uso das seguintes distribuigoes de probabilidade. 

Distribuigao normal 

A mais conhecida de todas as distribuigoes de probabilidade teoricas e a distribuigao normal, cuja 
figura em forma de sino e familiar a qualquer um com conhecimento estatistico minimo. 

Uma variavel aleatoria (continua) X e considerada normalmente distribmda se a sua FDP tem a 
seguinte forma: 

Ab exp (' 


fix) = 


2 a 2 


— OO < X < OO 
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FIGURA A.4 

Areas sob a curva 
normal. 



\< 68% (aproximadamente) ►] 

— 95% (aproximadamente) — 

— 99,7% (aproximadamente) — 


em que /z e cr, conhecidas como parametros da distribuigdo, sao, respectivamente, a media e a varian- 
cia da distribuicao. As propriedades dessa distribiii^ao sao as seguintes: 

1. Ela e simetrica em tomo do seu valor medio. 

2. Aproximadamente 68% da area sob a curva normal situa-se entre os valores de /z ± a, cerca 
de 95% da area situa-se entre p ± 2a, e cerca de 99,7% situa-se entre p ± 3a, como mostra 
a Figura A.4. 

3. A distribuicao normal depende de dois parametros p e a 2 ; como estes sao especificados, 
pode-se encontrar a probabilidade de que X se situara dentro de um certo intervalo ao utilizar 
a FDP da distribuicao normal. Mas essa tarefa pode ser facilitada consideravelmente ao 
consultarmos Tabela D.l do Apendice D. Para utilizarmos a tabela, convertemos a conheci- 
da variavel X de distribuicao normal com a media p e cr em uma variavel normal padro- 
nizada Z pela seguinte transformacao: 

x — p 

Z = - - 

a 


Uma importante propriedade de qualquer variavel padronizada e que o seu valor medio 
e zero e sua variancia e a unidade. Assim, Z possui media zero e variancia 1. Substituin- 
do z na fun?ao FDP dada anteriormente, obtemos: 


f(Z) = 



que e a FDP da variavel normal padronizada. As probabilidades apresentadas no Apendice 
D, Tabela D.l, sao baseadas na variavel normal padronizada. 

Por conven?ao, denotamos uma variavel distribuida de forma normal como: 

X ~ N{p, a 2 ) 

em que ~ significa “distribuido como”, N indica distribuicao normal e as quantidades entre 
parenteses sao os dois parametros da distribuicao normal, ou seja, a media e a variancia. 
Seguindo essa convencao, 

X ~ N(0, 1) 

significa que X e uma variavel de distribuicao normal com media zero e variancia 1. Em 
outras palavras, ela e a variavel normal padronizada Z. 
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EXEMPLO 18 Suponha que X ~ N( 8, 4). Qual a probabilidade de que X assumira um valor entre X^ = 4 

e X 2 = 12? Para calcularmos a probabilidade requerida, estimamos os valores de Z como: 


Zi 



Z 2 = 


X 2 - n 

a 


4-8 
2 ' 

12-8 

2 


- 2 


= + 2 


Agora, com base na Tabela D.1, observamos que Pr(0 < Z< 2) = 0,4772. Entao, por simetria, temos 
Pr(—2 < Z < 0) = 0,4772. Por conseguinte, a probabilidade requerida e 0,4772 + 0,4772 = 
0,9544. (Veja a Figura A.4.) 


EXEMPLO 19 Qual a probabilidade de, no exemplo anterior, X exceder 12? A probabilidade de que X 

exceda 12 e a mesma de que Z exceda 2. com base na Tabela D.1, e obvio que essa proba¬ 
bilidade e (0,5 — 0,4772) ou 0,0228. 


4. Sejam X\ ~ ,¥( \l 1 , of) c T ~ /V(/xi, erf) e su P on ha que elas sejam independentes. Con- 
sidere, agora, a combinagao linear 

Y = GfXi + 

em que ae b sao constantes. Entao, pode ser demonstrado que: 

Y ~ ^[(a/r-i + b\x 2 ), (a 2 &i + b 2 al)\ 

Esse resultado, que afirma que uma combinagao linear de variaveis de distribuigao normal 
e distribmda normalmente, pode ser facilmente generalizado para uma combina 5 ao linear de 
mais de duas variaveis de distribui§ao normal. 

5. Teorema central do limite. Considere que X h X 2 , ..., X„ denotem n variaveis aleatorias 

independentes, todas elas possuem a mesma FDP com media = /r e variancia = er. 
Seja X = Y, Xi/n (a media amostral). A medida que n aumenta indefinidamente (i.e .,72 00 ) 

X ~ n(h, —) 

\ n J 


Isto e, X aproxima-se da distribui 5 ao normal com media /./ e variancia a 1 /n. Repare que esse 
resultado e verdadeiro nao importando a forma da FDR Como resultado, temos: 


X- fi 
a/ 


a/«(X- u) 
o 


N{ 0, 1) 


Ou seja, Z e uma variavel normal padronizada. 

6. O terceiro e quarto momento da distribuigao normal em torno do valor medio sao como se 
segue: 

Terceiro momento: E(X - /x) 3 = 0 
Quarto momento: E(X — /x) 4 = 3cr 4 

Nota: todos os momentos de ordem fmpar em torno do valor medio de uma variavel normal¬ 
mente distribmda sao zero. 












Apendice A Revisao de alguns conceitos estatisticos 815 


7. Como resultado, e seguindo as medidas de assimetria e curtose discutidas anteriormente, 
para uma FDP normal, a simetria e = 0 e a curtose e = 3; uma distribuigao normal e sime- 
trica e mesocurtica. Portanto, um teste simples de normalidade e descobrir se os valores 
calculados de assimetria e curtose afastam-se das normas de 0 e 3. Esta e, de fato, a logica 
subjacente ao teste de normalidade Jarque-Bera (JB) discutido no livro: 


JB = n 


~S 2 (K- 3) 2 ' 

~6 + 24 


(5.12.1) 


em que S representa a assimetria e K, a curtose. Sob a hipotese nula da normalidade, JB e 
distribuido como uma estatistica qui-quadrado com 2 graus de liberdade. 


8 . A media e a variancia de uma variavel aleatoria com distribuigao normal sao independentes 
no sentido de que uma nao e fungao da outra. 


9. Se X e Y sao de distribuigao conjunta normal, elas sao independentes se, e apenas se, a cova- 
riancia entre elas [cov (A, Y )] e zero. (Veja o Exercicio 4.1.) 


A distribui^ao x 2 (qui-quadrado) 

Sejam Z b Z 2 ,..., Z k variaveis normais padronizadas independentes (variaveis normais com media 
zero e variancia 1). Entao a quantidade 

z = 

;=i 

possui a distribuigao x 2 com k graus de de liberdade (gl), em que o termo gl significa o ntimero de 
quantidades independentes na soma anterior. Uma variavel com distribuigao qui-quadrado e represen- 
tada por x% cm que o subscrito k indica o gl. Geometricamente, a distribuigao qui-quadrada aparece 
na Figura A.5. 

As propriedades da distribuigao x 2 sao as seguintes: 

1. Como demonstra a Figura A.5, a distribuigao x 2 e uma distribuigao assimetrica, o grau de as¬ 
simetria dependendo do gl. Para um gl relativamente pequeno, a distribuigao e altamente 
assimetrica para a direita; mas, a medida que o gl aumenta, a distribuigao torna-se progres- 
sivamente simetrica. Na verdade, para o gl superior a 100, a variavel 

yzx 2 - V(2 k~ i) 

pode ser tratada como uma variavel normal padronizada, em que k e o gl. 


FIGURA A.5 

Fungao da densidade 
da variavel x 2 - 


/Or 2 ) 
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2. A media de distribuigao qui-quadrado eke sua variancia e 2k, em que k e o gl. 

3. Se Z, e Z 2 sao duas variaveis qui-quadrados independentes com gl k x e k 2 , entao a soma Z x 
+ Z 2 e tambem uma variavel qui-quadrado com gl = k x + k 2 . 


EXEMPLO 20 Qual a probabilidade de obter um x 2 com valor de 40 ou maior, dado o gl de 20? Como 

mostra a Tabela D.4, a probabilidade de obter um x 2 com valor de 39,9968 ou maior (20 gl) 
e de 0,005. Portanto, a probabilidade de obter um x 2 com valor de 40 ou maior e menor do 
que 0,005, uma probabilidade bem pequena. 


Distribui^ao t de Student 

Se Z] e uma variavel normal padrao [Z x ~ N{ 0, 1)] e outra variavel Z 2 segue a distribuigao qui- 
-quadrada com k graus de liberdade e e distribufda independentemente de Z h a variavel definida 
como 


J(Z 2 /k) 

= £i VI 

segue a distribuigao 1 de Student com k graus de liberdade. Uma variavel com distribu^ao t e 
frequentemente designada como t k , em que o subscrito k denota os graus de liberdade. Geometri- 
camente, a distribu^ao t e apresentada na Figura A.6. 

As propriedades da distribui 5 ao t de Student sao as seguintes: 

1. Como a Figura A.6 demonstra, a distribu^ao t, assim como a distribu^ao normal, e simetri- 
ca, porem ela e mais achatada do que a distribu^ao normal. Contudo, a medida que aumen- 
tam os graus de liberdade, a distribu^ao t aproxima-se da distribu^ao normal. 

2. A media da distribu^ao t e zero e sua variancia e k/( k — 2). 

A distribuiyao t esta tabulada na Tabela D.2. 


EXEMPLO 21 Dado que os graus de liberdade sao iguais a 1 3, qual a probabilidade de obter um valor f 

(a) de cerca de 3 ou maior, (b) de aproximadamente —3 ou menor, e (c) com valor | t \ ou 
cerca de 3 ou maior, em que | t \ significa o valor absolute de f (nao levando em conta o sinal 
+ ou -)? 

Com base na Tabela D.2, as respostas sao: (a) cerca de 0,005, (b) cerca de 0,005 devido 
a simetria da distribuig:ao, e (c) cerca de 0,01 = 2(0,005). 


FIGURA A.6 

Distribuigao de t de 
Student para graus de 
liberdade selecionados. 



0 


t 
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FIGURA A. 7 

Distributo F para 
varios graus de 
liberdade. 



A distribui^ao F 

Se Zi e Z 2 sao variaveis que possuem uma distributo qui-quadrado independente com graus de 
liberdade k\ e k 2 , respectivamente, a variavel 

F= Z '/ kl 
Zil k 2 

segue a distribute F (de Fisher) com graus de liberdade k x e k 2 . Uma variavel com distributo F e 
representada por F k , k em que os subscritos indicam os graus de liberdade associados a duas variaveis 
Z, k\ sendo denominado grau de liberdade do numerador e k 2 , gran de liberdade do denominador. 
Geometricamente, a distributo F e demonstrada na Figura A.7 
A distributo F conta com as seguintes propriedades: 

1. Como a distribute qui-quadrado, a distributo F tem vies para a direita. Porem, pode-se 
demonstrar que, a medida que k l e k 2 tornam-se maiores, a distributo F aproxima-se da 
distributo normal. 

2. O valor medio de uma variavel com distributo F e k 2 /{ k 2 — 2), que e definido por k 2 > 2, 
e sua variancia e 

2kj(ki + k 2 - 2) 
k\ (k 2 - 2) 2 (k 2 - 4) 

que e definida por k 2 > 4. 

3. O quadrado de uma variavel aleatoria com distribuiyao 1 com k graus de liberdade possui 
uma distribute F com I e k graus de liberdade. Simbolicamente, 

i = F u 


EXEMPLO 22 Dado Iq = 10 e k 2 = 8, qual a probabilidade de obter um valor F (a) de 3,4 ou maior e (b) 

de 5,8 ou maior? Como demonstra a Tabela D.3, essas probabilidades sao (a) aproximada- 
mente 0,05 e (b) aproximadamente 0,01. 


4. Se o grau de liberdade do denominador, k 2 , e muito elevado, a seguinte retao ocorre entre 
as distributes F e qui-quadrado: 

k \F ~ xh 
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Para um grau de liberdade do denominador bastante alto, o grau de liberdade do numerador 
multiplicado pelo valor F e aproximadamente o mesmo de um valor qui-quadrado com grau 
de liberdade do numerador. 


EXEMPLO 23 Sejam <q = 20 e k 2 = 120. O valor Fcritico de 5% para esses graus de liberdade e 1,48. 

Por conseguinte, o Fde /q = (20)(1,48) = 29,6. Com base na distribuigao qui-quadrado para 
20 graus de liberdade, o valor qui-quadrado critico de 5% e cerca de 31,41. 

Por sinal, perceba que, como, para um grau de liberdade do denominador mais elevado, a distri- 
buigao t, a distribuigao qui-quadrado e a distribuigao F aproximam-se da distribuigao normal, essas 
tres distributees sao conhecidas como as distribuigdes relacionadas a distribuigao normal. 

Distribuigao binomial de Bernoulli 

Considera-se que uma variavel aleatoria X segue a distribuigao de Bernoulli, denominada assim 
em homenagem ao matematico sufgo, se a sua fungao de densidade (ou massa) de probabilidade 
(FDP) e: 

P(X = 0) = I - p 
P(X= 1)= p 

em que p, 0 <P<l,e a probabilidade de que algum evento seja um “sucesso”, como a probabilidade 
de obter cara no langamento de uma moeda. Para tal variavel, 

E{X) = [1 X p(X = 1) + 0 X p{X = 0)] = p 

var (X) = pq 

ou seja, q = (1 — p), a probabilidade de um “fracasso”. 

Distribuigao binomial 

A distribuigao binomial e a generalizagao da distribuigao de Bernoulli. Denotemos por n o numero 
de tentativas independentes, cada uma delas resulta em um “sucesso” com probabilidade p e um “fra¬ 
casso” com uma probabilidade q — (1 — p). Se X representa o numero do sucesso em n tentativas, 
entao diz-se que X segue a distribuigao binomial cuja FDP e: 

f(X)= (l\p\i- P y- X 

em que x representa o numero do sucesso em n tentativas e 

= n\ 

) x\(n — x)\ 

em que «!, lido como n fatorial, significa n( 11 — 1)( n — 2) • • • 1. 

A binomial e uma distribuigao de dois parametros, n e p. Para essa distribuigao: 

E(X) = np 

var (A) = np{ 1 - p) = npq 

Por exemplo, se langarmos uma moeda 100 vezes e quisermos descobrir a probabilidade de obter 
60 caras, colocamos na formula acima p = 0,5, n = 100 e x = 60. Existem rotinas de calculos para 
avaliagao de tais probabilidades. 

Podemos verifear como a distribuigao binomial e uma generalizagao da distribuigao de Bernoulli. 
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A distribui^ao de Poisson 

Considera-se que uma variavel aleatoria X tem uma distribui?ao de Poisson se a sua FDP e: 

e~ l X x 

f{X)= - e x = 0, 1,2,A, > 0 

x\ 

A distribuigao de Poisson depende de um parametro tinico, X. Uma caracterfstica distintiva da 
distribu^ao de Poisson e que a sua variancia e igual a seu valor esperado, que e X. Isto e, 

E{X) = var(X) = X 

O modelo de Poisson, como vimos no capftulo sobre os modelos de regressao nao linear, e utili- 
zado para modelar fenomenos raros ou infrequentes, como o numero de chamadas telefonicas rece- 
bidas em um intervalo de 5 minutos, ou o numero de multas por excesso de velocidade recebidas em 
um intervalo de uma hora, ou ainda os numeros de patentes recebidas por uma empresa em um ano. 


A.7 Inferencia estatistica: estima^ao 

Na Segao A.6, consideramos varias distributes de probabilidade teoricas. Muito frequentemente, 
sabemos ou estamos propensos a admitir que uma variavel aleatoria X segue uma distribui£ao de pro¬ 
babilidade particular, mas nao sabemos o(s) valor(es) do(s) parametro(s) da distribute. Por exemplo, 
se X segue a distribute normal, podemos querer saber o valor de seus dois parametros: a media e a 
variancia. Para estimarmos as incognitas, o procedimento habitual e supor que temos uma amostra 
aleatoria de tamanho n com base na distribu^ao da probabilidade conhecida e utilizar os dados da 
amostra para estimar os parametros desconhecidos. 5 Isso e chamado de problema da estimacao. Nes- 
ta seejao, examinaremos mais de perto esse problema. Ele pode ser dividido em duas categorias: esti- 
ma 5 ao pontual e estima 5 ao intervalar. 

Estimacao pontual 

Para melhor entendermos, seja X uma variavel aleatoria com FDP de/(x; 6), em que 0 e o para¬ 
metro da distributo (para simplificar a discussao, supomos que ha apenas um parametro desconhe- 
cido; nossa discussao pode ser facilmente generalizada). Suponha que conhecemos a forma 
funcional — conhecemos a FDP teorica, tal como a distribui 5 ao 1 —, mas nao conhecemos o valor 
de 6. Portanto, sorteamos uma amostra aleatoria de tamanho n a partir dessa FDP conhecida e desen- 
volvemos uma fun 5 ao dos valores da amostra, de modo que 

6 = f(x u x 2 ,...,x n ) 

fome 5 a-nos uma estimativa do verdadeiro 0. 0 € conhecido como uma estatistica, ou um estimador, 
e um valor numerico particular tornado pelo estimador e conhecido como estimativa. Perceba que 0 
pode ser tratada como uma variavel aleatoria poque e uma I'uncao dos dados amostrais. 0 nos forne- 
ce uma regra, ou formula, que nos conta como estimamos o verdadeiro 0. Assim, se admitimos que 

1 

0 = — (x 1 + x 2 + -1- x „) = X 

n 

em que lea media da amostra, entao X e um estimador do verdadeiro valor da media, por exemplo, 
/x. Se, em um caso especifico, X — 50, isso fornece uma estimativa de /x. O estimador 0 obtido pre- 
viamente e conhecido como estimador pontual, por fornecer apenas uma estimativa unica (pontual) 
de 0. 


5 Sejam X 1( X 2 , ■ . ■, X n n variaveis aleatorias com FDP conjunta f ( x 1( x 2 , . . ., x n ). Se podemos escrever 

f(x 1 ,x 2 ,...,x n )= f(xi)f(x 2 )--- f(x r ) 

em que f (x) e a FDP comum de cada X, entao, diz-se que x v x 2 , . . ., x„ constituem uma amostra aleatoria de 
tamanho n com base em uma populagao com FDP f (x„). 
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Estimagao intervalar 

Em vez de obtermos apenas uma estimativa unica de 0, suponha que obtenhamos duas estimativas 
de 0 ao construirmos dois estimadores x 2 , ■ ■ ■ , x„) e 0 2 ( x 2 , , x n ), e, com alguma 

confianga (probabilidade), que o intervalo entre 0, e 0 2 inclui o verdadeiro 6. Na estimagao intervalar, 
em contraste com a estimagao pontual, fomecemos uma amplitude de valores possrveis dentro dos 
quais o verdadeiro 6 pode estar. 

O conceito principal por tras da estimagao intervalar e a nogao de amostra, ou probabilidade de 
distribuigao, de um estimador. Por exemplo, pode-se demonstrar que, se uma variavel X possui 
distribuigao normal, a media da amostra X tambem possui distribuigao normal com media = p (a media 
verdadeira) e variancia = cr 2 / n, em que neo tamanho da amostra. Em outras palavras, a distribuigao 
amostral, ou probabilidade, do estimador X e X ~ A'(p, o 2 /n). Como resultado, se construirmos o 
intervalo 

a 

X± 2— 
yjn 

e dissermos que a probabilidade e de aproximadamente 0,95, ou 95%, intervalos como esse incluirao 
o verdadeiro p, estamos, de fato, construindo um estimador de intervalo para p. Perceba que o inter¬ 
valo fornecido anteriormente e aleatorio, uma vez que e baseado em X, que variara de amostra para 
amostra. 

De forma mais geral, na estimagao intervalar, construimos dois estimadores 0 X e 0 2 , ambos fun- 
goes dos valores amostrais de X, de maneira que: 

Pr(0i < 0 < 0 2 ) = 1 - a 0 < a < 1 

ou seja, podemos afirmar que e de 1 — a a probabilidade de que o intervalo de 0 { a 0 2 contenha o 
verdadeiro 0. Este e conhecido como intervalo de confianga de tamanho 1 — a para 0, 1 — a sendo 
conhecido como eoefieiente de confianga. Se a = 0,05, entao 1 — a = 0,95, significando que, se 
construimos um intervalo de confianga com um eoefieiente de confianga de 0,95, entao nas constru- 
goes repetidas resultantes de amostras repetidas deveremos estar certos em 95 de 100 casos, se afir- 
marmos que o intervalo contem o verdadeiro 0. Quando o eoefieiente de confianga e 0,95, 
frequentemente dizemos que temos um intervalo de confianga de 95%. Em geral, se o eoefieiente de 
confianga e de 1 — a, dizemos que temos um intervalo de confianga de 100(1 — a)%. Perceba que a 
e conhecido como o nfvel de significancia ou a probabilidade de cometer um erro de Tipo I. Esse 
topico e discutido na Segao A.8. 

EXEMPLO 24 

Suponha que a distribuigao da altura dos homens de uma populagao possua distribuigao 
normal com media = p polegadas e a = 2,5 polegadas. Uma amostra de 100 homens tirada 
de forma aleatoria dessa populagao tern uma media de altura de 67 polegadas. Estabelega 
um intervalo de confianga de 95% para a media de altura (= p) da populagao como um 
todo. 

Como foi notado, X ~ N( p, cr 1 / ri), que, nesse caso, torna-se X ~ N{ p, 2,5 2 / 100). Pela 
Tabela D.l , pode-se verificar que 

X - 1,96 [ | < p < X + 1,96-^= 

WnJ Vn 

cobre 95% da area sob a curva normal. Portanto, o intervalo anterior fornece um intervalo 
de confianga de 95% para p. Inserindo os valores fornecidos deX, ere n, obtemos o intervalo de 
confianga de 95% como 


66,51 < p < 67,49 


( Continua ) 
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EXEMPLO 24 

( Continuagdo ) 


Em mensura^oes repetidas como essa, os intervalos assim estabelecidos incluirao o verdadei- 
ro p com 95% de confianga. Um comentario tecnico pode ser feito aqui. Embora possamos 
dizer que a probabilidade de que o intervalo aleatorio [ X ± 1,96(cr/ fn)] inclui p seja de 95%, 
nao podemos dizer que seja de 95% a probabilidade de que o intervalo particular (66,51, 
67,49) inclua p. Como esse intervalo e fixado, a probabilidade de que ele incluira p e 0 ou 1 . 
O que podemos afirmar e que, se construirmos 100 desses intervalos, 95 dos 100 intervalos 
incluirao p; nao podemos garantir que um intervalo em particular incluira necessarimante p. 


Metodos de estima^ao 

De maneira geral, ha tres metodos de cstimacpio de parametros: (1) minimos quadrados (MQ), (2) 
maxima verossimilhanga (MV) e (3) metodo dos momentos (MM) e sua extensao, o metodo dos mo- 
mentos generalizado (MMG). Temos dedicado tempo consideravel para ilustrar o metodo dos minimos 
quadrados. No Capftulo 4, introduzimos o metodo da maxima verossimilhan 9 a no contexto da regres- 
sao, mas esse metodo possui uma aplica 9 ao muito mais ampla. 

A ideia-chave por tras do metodo da verossimilhanga e a funt.ao de verossimilhant.a. Para ilustrar, 
suponha que a variavel aleatoria X possui FDP/(A, 0) que depende de um parametro linico 0. Conhe- 
cemos a FDP (por exemplo, de Bernoulli ou binomial), mas nao conhecemos o valor do parametro. 
Suponha que obtenhamos uma amostra aleatoria de nX valores. A FDP conjunta desses n valores e: 

g(xi,x 2 , ...,x n ;6) 

Por ela ser uma amostra aleatoria, podemos escrever a FDP conjunta anterior como um produto das 
FDPs individuals: 


g(xi,x 2 , ...,x„;0)= f(x i; 6)f(x 2 ) 0) • • ■ f(x„; 0) 

A FDP conjunta possui uma interpreta 5 ao dual. Se 0 6 conhecido, interpretamos como uma FDP 
conjunta de se observar os dados de valores amostrais. Por outro lado, podemos trata-la como uma 
fun 9 ao de 0 para valores de x h x 2 ,, x„. Na segunda interpreta^ao, chamamos a FDP conjunta de 
fun^ao de verossimilhan^a e escrevemos como: 

L(d; x\,x 2 , ...,x n )= fix i; d)f(x 2 ; &)■■■ f(x n ; 0) 

Observe a inversao do papel de 0 na fun 9 ao de densidade de probabilidade conjunta e na fun 9 ao de 
verossimilhan 9 a. 

O estimador de maxima verossimilhan 9 a de 0 e aquele valor de 0 que maximiza a fun 9 ao de veros- 
similhan 9 a (da amostra), L. Por uma conveniencia matematica, em geral tomamos o logaritmo da 
verossimilhan 9 a, chamado fun 9110 log de verossimilhanga (log L). Seguindo as regras de calculo 
da maximiza 9 ao, diferenciamos a fun 9 ao log de verossimilhan 9 a com respeito a incognita e iguala- 
mos a derivada resultante a zero. O valor resultante do estimador e chamado estimador de maxima 
verossimilhan 9 a. Pode-se aplicar a condi 9 ao de maximiza 9 ao de segunda ordem para assegurar que 
o valor que obtivemos e, de fato, o valor maximo. 

No caso de haver mais de um parametro desconhecido, diferenciamos a fungao log de verossimi- 
lhan 9 a com respeito a cada incognita, igualamos as expressoes resultantes a zero e solucionamos si- 
multaneamente para obter os valores dos parametros desconhecidos. Ja demonstramos isso com 
rela 9 ao ao modelo de regressao multipla (veja o Capftulo 4, Apendice 4A1.). 


EXEMPLO 25 Suponha que a variavel aleatoria X siga a distribuifao de Poisson com o valor medio de X. 

Suponha que x u x 2l . . ., x n sejam variaveis aleatorias de Poisson independentes, cada uma 
com media X. Suponha que queiramos descobrir o estimador de maxima verossimilhanfa de 
X. A funfao de verossimilhanfa aqui e: 

( Continua ) 
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EXEMPLO 25 

( Continuagao ) 


L (xi, x 2 ,.. ■, x„; X) = 


e k X K ' e x X* 2 
x-\\ x 2 \ 

q- nkyJZxj 

Xi! x 2 !-•■ x n \ 


e x X Xn 
x n \ 


Essa e uma expressao razoavelmente diffcil de manejar, mas, se tomarmos o seu log, ela se 
torna 


log (xi , x 2 , ■ ■ ■, x n ; X) = - nX + ^ x, log X - log c 

em que log c = Fix,!. Diferenciando a expressao anterior com respeito a X, obtemos 
(- n + Q2 K i) A)- Igualando essa ultima expressao a zero, obtemos x m i = (J2 x i)/ n = X, P 1 - 16 ® ° 
estimadorde maxima verossimilhang:a da incognita X. 


Metodo dos momentos 

Apresentamos uma nocao do metodo dos momentos no Exercfcio 3.4 no chamado principio da 
analogia, no qual os momentos da amostra tentam duplicar as propriedades de suas contrapartes na 
popula 5 ao. O metodo dos momentos generalizado (MMG), que e uma generaliza 5 ao do MM, agora 
esta tornando-se mais popular, porem, nao em um nfvel introdutorio. Desse modo, por ora, nao trata- 
remos dele. 

As propriedades estatisticas desejaveis agrupam-se em duas categorias: propriedades das amos- 
tras pequenas, ou amostras finitas, e propriedades das amostras grandes, ou assintoticas. Por tras 
desses conjuntos de propriedades esta a no 5 ao de que um estimador possui uma distribu^ao em 
amostra, ou de probabilidade. 

Propriedades de pequenas amostras 

Sem vies 

Um estimador 0 6 chamado de estimado nao tendencioso (nao viesado) e de 9 se o valor esperado 
de 0 for igual ao verdadeiro 0; isto e. 


E(G) = 6 


ou 


E0) -6-0 

Se essa igualdade nao se sustenta, o estimador e conhecido como viesado, e o vies e calculado 
como: 


vies (6) = E0 ) - 6 

E claro, se E(9) — 6 — isto e, 6 e um estimador nao viesado — o vies e zero. 

Geometricamente, a situa 5 ao e representada na Figura A.8. Observe que a nao tendenciosidade e uma 
propriedade das amostras repetidas, nao de qualquer amostra: mantendo o tamanho da amostra fixo, ex- 
traimos varias amostras, obtendo, cada vez, uma estimativa do parametro desconhecido. Espera-se que o 
valor medio dessas estimativas seja igual ao valor verdadeiro se o estimador nao possuir vies. 

Varidncia minima 

Diz-se que 9 e um estimador de minima variancia de 9 se a variancia de 6\ for menor, ou pelo 
menos igual, a variancia de 0 2 , que e qualquer outro estimador de 9. Geometricamente, temos 
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FIGURA A.8 

Estimadores viesados 
e nao viesados. 



a Figura A.9, que mostra os tres estimadores de 9, ou seja, 0 h 0 2 , e 0 3 , e suas distributes de proba- 
bilidade. Como demonstrado, a variancia de 9 2 e menor que as de 9\ e 9 2 . Entao, admitindo apenas os 
tres estimadores possrveis, neste caso, 9 2 e um estimador de variancia minima. Porem, perceba que 9 2 
e um estimador tendencioso (por que?). 

Melhor estimador nao viesado ou estimador eficiente 

Se e 9 2 sao dois estimadores nao viesados de 9, e a variancia de f)\ e menor, ou no maximo, igual 

a variancia de 0 2 , 9 X e um estimador nao viesado de variancia minima, ou melhor nao viesado, 
ou eficiente. Na Figura A.9, dos dois estimadores nao viesados, 9 X e 0 2 , 9\ e o melhor nao viesado, ou 
eficiente. 

Linearidade 

Um estimador a 0. e conhecido como um estimador linear de 0 se ele e uma funcao linear das 
observa 9 oes da amostra. A media da amostra definida como 

X — — N X\ = —(xi + x 2 + ■ • * + x w ) 
n z —' n 

e um estimador linear, porque e uma fun 9 ao linear dos valores de X. 

Melhor estimador linear nao viesado ou estimador eficiente 

Se a 0 e linear, e nao viesado, e possui uma variancia minima no grupo de todos os estimadores 
lineares nao viesados de 9, ele e chamado de melhor estimador linear nao viesado, ou, para resu- 
mir, BLUE. 

Estimador com erro quaclrado medio mmimo (MSE) 

O MSE de um estimador 9 e definido como 

MSE(0) = E(9 - 6) 2 


FIGURA A.9 

Distribuijao de tres 
estimadores de 6. 
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Isso contrasta com a variancia de 0 , que se define como: 

var(0) = E[8 - E(9)] 2 

A difercnca entre as duas e que a var (0) mensura a dispersao da distribui^ao de 9 em torno da sua 
media, ou valor esperado, enquanto o MSE(<9) mensura a dispersao em torno do valor verdadeiro do 
parametro. A rela?ao entre as duas e como se segue: 

MSE(0) = E{9 - 9) 2 

= E[9 - E{9) + E{9) - 0] 2 

= E[9 - E(9)] 2 + E[E{9) - 0] 2 + 2 E[9 - E{8)][E{6) - 9] 

= E[9 - E(d)] 2 + E[E{0) - 6\ 2 uma vez que o ultimo termo e zero 6 
= var(0) + vies(0) 2 

= varancia de 9 mais o quadrado do vies 

Naturalmente, se o vies e zero, MSE (9) — var (9). O criterio MSE mi'nimo consiste em escolher 
um estimador cujo MSE seja o menor em um conjunto de estimadores concorrentes. Observe que, 
mesmo se tal estimador for encontrado, ha um trade-off e nvolvido — para obter uma variancia mini¬ 
ma, podemos ter de aceitar algum vies. Geometricamente, a situa 5 ao e apresentada na Figura A. 10. 
Nesta figura, 9 2 e levemente viesado, mas sua variancia e menor do que a do estimador nao viesado 
9 j. Na pratica, contudo, o criterio MSE mfnimo e utilizado quando o criterio do melhor nao 
viesado e incapaz de produzir estimadores com variancias menores. 

Propriedades de grandes amostras 

Em geral, acontece de um estimador nao satisfazer uma ou mais das propriedades estatfsticas 
desejaveis em amostras pequenas. Contudo, a medida que o tamanho da amostra cresce indefinida- 
mente, o estimador possui varias propriedades estatfsticas desejaveis. Essas propriedades sao conhe- 
cidas como propriedades de amostras grandes, ou assintoticas. 


FIGURA A.10 



E0O 


Ausencia assintotica de vies. 

Um estimador 9 e considerado um estimador assintoticamente nao viesado de 9 se 

lim E(9 n ) = 9 


6 0 ultimo termo pode ser escrito como 2{[E0)] 2 - [f (6)] 2 - 8E0) + 9E (0)} = 0. Observe tambem que 
E [£ (0) - 9] 2 = [£ (0) - 0] 2 , posto que o valor esperado de uma constante e simplesmente a propria constante. 







Apendice A Revisao de alguns conceitos estatisticos 825 


emque 9 n significa queo estimador ebaseadono tamanho daamostrade n, limsignificaliniite en-> oo 
indica que n cresce indefinidamente. Em outras palavras, 9 e um estimador assintoticamente nao 
viesado de 9 se o seu valor esperado, ou media, aproxima-se do valor verdadeiro a medida que o ta¬ 
manho da amostra torna-se cada vez maior. Como exemplo, considere a seguinte mensuragao da 
variancia amostral de uma variavel aleatoria X : 

^ = YXXi ~ ^) 2 

n 

Pode-se demonstrar que 

E(S 2 )= <x 2 (l- ^ 


em que er e a verdadeira variancia. E obvio que, em uma amostra pequena, S 2 6 viesado, mas a me¬ 
dida que n cresce indefinidamente, E(S 2 ) aproxima-se do verdadeiro a 2 ; portanto, e assintoticamente 
nao viesado. 

Consistencia 

Diz-se que 9 e um estimador consistente se ele se aproxima do valor verdadeiro 9 a medida que o 
tamanho da amostra torna-se cada vez maior. A Figura A. 11 ilustra a propriedade. Na figura, temos a 
distribuigao de 9 baseada no tamanho das amostras de 25, 50, 80 e 100. Como mostra a figura, 9 ba¬ 
seado em n — 25 e viesado, posto que sua distribui^ao amostral nao e centrada no verdadeiro 9. Po- 
rem, a medida que n cresce, a distribui 5 ao de 9 nao apenas tende a ser mais proximamente fechada 
em 9 (9 torna-se menos viesado), mas sua variancia tambem torna-se menor. Se, no limite (quando n 
cresce indefinidamente), a distribuipao de 9 convergir para um unico ponto 9, isto e, se a distribuigao 
de 9 tiver dispersao, ou variancia, zero, dizemos que 9 e um estimador consistente de 9. 


FIGURA A.11 

A distribuigao de 9 a 
medida que a amostra 
cresce. 



Diz-se, mais formalmente, que 9 e um estimador consistente de 9 se a probabilidade de que o 
valor absoluto da dilcrcnca entre 9 e 9 seja menor do que 8 (uma quantidade positiva arbitrariamente 
pequena) aproxima-se de 1 quando n tende ao infinito. Simbolicamente, 
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EXEMPLO 26 


lim P{\9- 0\ < 5}= 1 8 > 0 

n—>°o 

em que P significa probabilidade. Isso e frequentemente expresso como 

plim0 = 0 

n— 

em que plim indica o limite em probabilidade. 

Perceba que as propriedades de nao tendenciosidade de consistencia sao conceitualmente muito dife- 
rentes. A propriedade de nao tendenciosidade pode compreender qualquer tamanho de amostra, enquanto 
a consistencia e estritamente uma propriedade das amostras grandes. 

Um condiqdo suficiente para a consistencia e que tanto o vies quanto a variancia tendam a zero a 
medida que o tamanho da amostra cresce indefinidamente. 7 Por outro lado, uma condi? ao suficiente 
para a consistencia e que o quadrado medio mi'nimo MSE(0) tende a zero a medida que n cresce in¬ 
definidamente. (Para MSE[ 9], vejaa discussao anteriormente apresentada.) 


Seja Xi, X 2 , ..., X n uma amostra aleatoria com base em uma distribuifao com media p e 
variancia a 1 . Demonstre que a media X da amostra e um estimador consistente de p. 

Por meio de estatfsticas elementares, sabe-se que £(X) = p e var(X) = a 2 3 In. Uma vez 
que £ (X) = p independentemente do tamanho da amostra, ele e nao viesado. Alem disso, a 
medida que n cresce indefinidamente, a var (X) tende a zero. Por isso, X e um estimador 
consistente de p. 


As seguintes regras sobre a probabilidade sao dignas de nota. 


1 . 


Invariancia (propriedade de Slutsky). Se 6 for um estimador consistente de 9, e se li(9) for 
qualquer funtjao de 6 , entao 

plim/?(0) = h(9) 

n—>°o 


O que isso significa e que, se 9 for um estimador consistente de 9, 1 /9 sera tambem um esti¬ 
mador consistente de 1/6 e que log (9) sera tambem um estimador consistente de log (9). 
Perceba que essa propriedade nao e valida para o operador de expectativa E; isto e, se 9 for 
um estimador nao viesado de 9 (isto e, E[0] — 9), nao sera verdade que 1/6 e um estimador 
nao viesado de 1 / 6 \ isto e, E(\/ 6 ) A 1 /E( 6 ) =1/9. 

2. Se b e uma constante, 

plim b = b 

n—>°° 


Ou seja, o limite em probabilidade de uma constante e a mesma constante. 

3. Se 0! e 0 2 forem estimadores consistentes, 

plim (0i + 02 ) = plim 0i + plim 02 
plim ( 0 i 02 ) = plim 0i plim 02 


plim 



plim 0i 
plim 02 


As duas ultimas propriedades, em geral, nao sao validas para o operador de expectativa E. 
Assim, E( 61 / 62 ) A E( 6 \)/E( 02 ). De maneira semelhante, E( 6 \ 6 2 ) A E(9\) E( 6 2 ). Se, entre- 
tanto, 0i e 0 2 forem distribufdos independentemente, £(0102) = £(0i) E( 6 2 ), como observa- 
do anteriormente. 


7 Mais tecnicamente, lim„ „ £ ( 6 n ) = 8 e lim n „ var ( 8 n ) = 0. 
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Eficiencia assintotica 

Seja 9 um estimador de 9. A variancia da distribuigao assintotica de 9 6 chamada de variancia 
assintotica de 9. Se 6 for consistente e a sua variancia assintotica for menor do que a variancia assin¬ 
totica de todos os estimadores consistentes de 9, 9 e chamado de assintoticamente eficiente. 

Normalidade assintotica 

Um estimador 9 e considerado ter distribuigao assintoticamente normal se sua distribuigao amos- 
tral tende a aproximar-se da distribuigao normal a medida que o tamanho da amostra n cresce indefi- 
nidamente. Por exemplo, a teoria estatistica demonstra que, se X u X 2 , . . . , X n sao variaveis 
independentes com distribuigao normal e possuem a mesma media /re a mesma variancia a 2 , a media 
da amostra X tambem possui distribuigao normal com media p e variancia <t 2 /« em amostras pe- 
quenas e tambem em amostras grandes. Contudo, se os X t forem independentes com media p e 
variancia a 2 , mas nao necessariamente pertencerem a distribuigao normal, a media da amostra X 
possuira distribuigao assintoticamente normal com media p e variancia er/n; ou seja, a medida 
que o tamanho da amostra n cresce indefinidamente, a media da amostra tende a ser normalmente 
distribufda com media /z e variancia <j 2 /n. Na verdade, esse e o teorema central do limite previa- 
mente discutido. 


A.8 Inferencia estatistica: testando as hipoteses 

A estimagao e o teste da hipotese constituem os ramos gemeos da inferencia estatistica classica. 
Ao examinarmos o problema da estimagao, examinaremos brevemente o problema do teste estatisti- 
co de hipoteses. 

O problema do teste de hipotese pode ser estabelecido da seguinte forma: admita que tenhamos 
uma variavel aleatoria X com uma FDP conhecida/(x; 0), em que 0 e o parametro da distribuigao. Ao 
obtermos uma amostra aleatoria de tamanho n, obtemos o estimador pontual 0. Uma vez que o ver- 
dadeiro 0 e raramente conhecido, levantamos a questao: o estimador 9 e “compativel” com algum 
valor hipotetico de 9, por exemplo, 9 = 9*, em que 9* e um valor numerico especifico de 91 Em 
outras palavras, poderia a nossa amostra ser proveniente da FDP/(x; 9) = 9*1 Na linguagem de 
teste da hipotese, 9 — 9* e chamado hipotese nula (ou sustentada) e e geralmente denotada por 
H 0 . A hipotese nula e testada contra uma hipotese alternativa, denotada por H l , que, por exem¬ 
plo, pode estabelecer que 9 A 9*. ( Nota: em alguns livros, H Q e Hi sao designados por F/j e H 2 , 
respectivamente.) 

A hipotese nula e a hipotese alternativa podem ser simples ou compostas. Uma hipotese e deno- 
minada simples se especifica o(s) valor(es) do(s) parametro(s) de distribuigao; do contrario, e 
chamada de hipotese composta. Assim, se X ~ Nip, a 1 ) e afirmamos que 

Hq: p = 15 e a = 2 

e uma hipotese simples, enquanto 

Hq: p = 15 e cr>2 

e uma hipotese composta porque aqui o valor de a nao e especificado. 

Para testarmos a hipotese nula (por exemplo, para testar sua validade), utilizamos a informagao da 
amostra para obter o que e conhecido como estatistica de teste. Muito frequentemente, essa estatis¬ 
tica de teste torna-se o estimador pontual do parametro desconhecido. Entao, tentamos descobrir a 
distribuigao da amostra ou da probabilidade da estatistica de teste e utilizamos a abordagem do in- 
tervalo de confianga ou o teste de sigitiftcdncia para testar a hipotese nula. O mecanismo e ilustrado 
a seguir. 
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Para melhor entendermos, vamos voltar ao Exemplo 24, que diz respeito a altura (X) dos homens 
em uma populagao. Dizemos que 

X; ~ N(9 , cr 2 ) = N(/d,2,5 2 ) 

X = 67 n = 100 


Vamos admitir que 

Ho- li = id = 69 
H\ . fi ^ 69 


A questao e: poderia a amostra com X — 67, a estatfstica de teste, ter sido extrafda da populagao 
com o valor medio de 69? Intuitivamente, nao podemos rejeitar a hipotese nula se X e “suficientemen- 
te proximo” de //*; ou entao podemos rejeita-la em favor da hipotese alternativa. Como decidimos que 
X e “suficientemente proximo” de /r? Podemos adotar duas abordagens, (1) intervalo de confianga e (2) 
teste de significancia, ambas levando a conclusoes identicas em qualquer aplicagao especifica. 

A abordagem do intervalo de confianga 

Posto que X t ~ N(6, cr), sabemos que a estatfstica de teste X e distribufda como 

X ~ N(/d, a 2 /n ) 


Uma vez que conhecemos a distribu^ao de probabilidade de X, por que nao estabelecer, por 
exemplo, urn intervalo de confianga de 100(1 — a) para /i baseado em X e verificar se esse intervalo 
de con bang a inclui /d = //*? Se incluir, nao poderemos rejeitar a hipotese nula; se nao incluir, pode- 
remos rejeitar a hipotese nula. Assim, se a = 0,05, teremos um intervalo de confianga de 95%, e, se 
este intervalo de confianga incluir, /d *, nao poderemos rejeitar a hipotese nula — 95 dentre 100 inter- 
valos assim estabelecidos deverao provavelmente incluir /i*. 

O procedimento e como se segue: uma vez que X ~ A(/i, cr/ri), segue-se que 


X - id 
o/ s/n 


N{ 0, 1) 


ou seja, uma variavel normal padrao. Por meio da tabela de distribuigao normal, sabemos que 

Pr(- 1,96 < Z, < 1,96) = 0,95 


Isto e, 


Pr 


1,96 < 


X - id 
a/ Jn 


< 



0,95 


que, rcarranjada, resulta em 


Pr 



1,96-^= < fd <X+ 1,96 
V w 



0,95 


Isso e um intervalo de confianga para /x. Uma vez que esse intervalo foi estabelecido, o teste da 
hipotese nula e simples. Tudo o que temos de fazer e verificar sc /x = /U esta nesse intervalo. Se es- 
tiver, nao poderemos rejeitar a hipotese nula; se nao estiver, poderemos rejeita-la. 
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FIGURA A.12 

Intervalo de confianga 
de 95% para /x. 



Voltando ao Exemplo 24, ja estabelecemos um intervalo de confianga de 95% para //, que e 

66,51 < /x < 67,49 

Obviamente, esse intervalo nao inclui /x = 69. Por conseguinte, podemos rejeitar a hipotese nula 
de que o verdadeiro /x e 69 com um coeficiente de confianga de 95%. Geometricamente, a situagao e 
como apresentada na Figura A. 12. 

Na linguagem do teste de hipoteses, o intervalo de confianga que estabelecemos e chamado de 
regiao de aceitagao e a(s) area(s) fora da(s) regiao(oes) e(sao) chamada(s) regiao(Ses) critica(s) ou 
regiao(oes) de rejeigao da hipotese nula. Os limites inferior e superior da regiao de aceitagao (que a 
separam das regioes de rejeigao) sao chamados valores crfticos. Nessa linguagem do teste de hipo¬ 
teses, se o valor hipotetico recair na regiao de aceitagao, nao se podera rejeitar a hipotese nula; caso 
contrario, pode-se rejeita-la. 

E importante observar que, ao decidir rejeitar ou nao a H 0 , pode vir a ocorrer dois tipos de erros: 
(1) podemos rejeitar // O quando ela for, de fato, verdadeira; este e o chamado erro tipo I (no exemplo 
anterior, X = 67 poderia ser proveniente da populagao com um valor medio de 69); ou (2) podemos 
nao rejeitar H 0 quando ela for, de fato, falsa; este e chamado de erro tipo II. Portanto, um teste de 
hipotese nao estabelece o valor do verdadeiro /x. Ele apenas fomece meios de decidir se podemos agir 
como se /x = /x*. 

Erros do tipo I e do tipo II 

Esquematicamente, temos 


Decisao 

Rejeitar 
Nao rejeitar 


Situagao 

Ho e verdadeira Ho e falsa 

Erro do tipo I Nao ha erro 

Nao ha erro Erro do tipo II 


Idealmente, gostarramos de minimizar tanto os erros do tipo I quanto os do tipo II. Infelizmente, 
para qualquer tamanho de amostra, nao e possfvel minimizar ambos os erros simultaneamente. A 
abordagem classica a esse problema, incorporada ao trabalho de Neyman e Pearson, e supor que um 
erro do tipo I seja provavelmente mais serio, na pratica, do que um erro do tipo II. Deverfamos man- 
ter a probabilidade de cometer um erro do tipo I em um nfvel bem baixo, como 0,01 ou 0,05, e entao 
tentar minimizar a probabilidade de cometer um erro do tipo II quanto for posst'vel. 

Na literatura, a probabilidade de um erro do tipo I e designada como a e e chamada de nfvel de 
significancia, e a probabilidade de um erro do tipo II e designada como (i. A probabilidade de nao 
cometer um erro do tipo II e chamada de potencia do teste. Em outras palavras, a potencia de um 
teste e a sua capacidade de rejeitar uma falsa hipotese nula. A abordagem classica ao teste de hipo¬ 
tese e fixar a em rn'veis como 0,01 (ou 1%) ou 0,05 (5%) e tentar maximizar a potencia do teste; ou 
seja, minimizar ft. 










830 Apendice A Revisao de alguns conceitos estatisticos 


E importante que o leitor compreenda o conceito da potencia de um teste, que e mais bem explicado 
com um exemplo. 8 Seja X ~ /V(/x, 100), ou seja, X tern distribu^ao normal com media // e variancia 
100. Suponha que a — 0,05. Suponha que tenhamos uma amostra de 25 observa£6es, que forneca um 
valor medio da amostra de X. Alem disso, suponha que consideremos a hipotese H 0 : /x — 50. Posto 
que X e normalmente distribuldo, sabemos que a media da amostra e tambem normalmente distribul- 
da como: X ~ ;V(/x, 100/25). Dal, estabelecida a hipotese nula de que /x = 50, o intervalo de con- 
fianpa de 95% para (/x ± 1,96(^/100/25) = /x ± 3,92, ou seja, (46,08 a 53,92). Portanto, a regiao 
crftica consiste em todos os valores de X menores que 46,08 ou maiores que 53,92. Rejeitaremos a 
hipotese nula de que a media verdadeira e 50 se o valor da media da amostra estiver abaixo de 46,08 
ou maior que 53,92. 

Porem, qual a probabilidade de que X esteja situado na(s) regiao(oes) crftica(s) anterior(es) se o 
verdadeiro possui um valor diferente de 50? Suponha que haja tres hipoteses alternativas: /x = 48, 
/x = 52 e /x = 56. Se alguma dessas alternativas for verdadeira, ela sera a media real da distribui£ao 
de X. O desvio padrao nao e modificado para as tres alternativas, uma vez que er ainda se pressupoe 
como 100. 

As areas sombreadas na Figura A. 13 demonstram as possibilidades de que X recaira sobre a regiao 
critica se cada uma das hipoteses alternativas for verdadeira. Como se pode verificar, essas possibili¬ 
dades sao 0,17 (para /x = 48), 0,05 (para /x = 50), 0,17 (para /x = 52) e 0,85 (para /x = 56). Como se 
pode verificar nessa figura, sempre que o verdadeiro valor de // difere substancialmente da hipotese em 
considera 5 ao (que aqui e /x = 50), a probabilidade de rejeitar a hipotese e alta; porem, quando o ver¬ 
dadeiro valor nao e muito diferente do valor dado para a hipotese nula, a probabilidade de reje^ao e 
menor. Intuitivamente, isso deveria fazer sentido se as hipoteses nula e alternativa fossem muito proxi- 
mamente agrupadas. 


FIGURA A.l 3 

Distribui§ao de X 
quando N = 25, 
a = 10, e /x = 48, 50, 
52, ou 56. Na H : 

/x = 50, a regiao 
crftica com a = 0,05 
e X < 46,1 e X > 
53,9. A area 
sombreada indica a 
probabilidade de que 
X recaia sobre a 
regiao crftica. Essa 
probabilidade e: 


/i = 48 



44 46 48 50 52 54 56 58 60 62 

I I 



0,17 se/x = 48 
0,05 se /x = 50 


0,17 se/x = 52 
0,85 se/x = 56 


Isso pode ser visto mais adiante quando consideramos a Figura A. 14, chamada grafico da fungao 
potencia; a curva demonstra que ha a chamada curva de potencia. 


8 A proxima discussao e os graficos sao baseados em Walker, Helen M.; Lev, Joseph. Statistical inference. Nova York: 
Holt, Rinehart e Winston, 1953. p. 161-162. 
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O leitor percebera que o coeficiente de confianpa (1 — a) discutido anteriormente e apenas 1 me- 
nos a probabilidade de que se cometa um erro do tipo I. Assim, um coeficiente de confianpa de 95% 
significa que estamos preparados para aceitar no maximo uma probabilidade de 5% de cometer um 
erro do tipo I — nao queremos rejeitar a hipotese verdadeira mais do que 5 vezes em 100. 

O valor p ou nlvel exato de significancia 

Em vez de fazer uma pre-sele?ao de a em nfveis arbitrarios, como 1, 5 ou 10%, pode-se obter o 
valor p (probabilidade) ou nivel exato de significancia de uma estatfstica de teste. O valor p e de- 
finido como o menor nivel de significancia a que uma hipotese nula pode ser rejeitada. 

Suponhamos que, em uma aplica£ao envolvendo 20 graus de liberdade, obtenhamos um valor t de 
3,552. Agora, o valor p, ou probabilidade exata, de obter um valor t de 3,552 ou superior a isso pode 
ser verificado na Tabela D.2 como 0,001 (unicaudal) ou 0,002 (bicaudal). Podemos afirmar que o 
valor t observado de 3,552 e estatisticamente significativo no nivel 0,001 ou 0,002, dependendo de 
utilizarmos um teste unicaudal ou bicaudal. 

Agora, varios pacotes estatisticos rotineiramente apresentam o valor p das estatisticas de teste 
estimadas. Portanto, aconselha-se ao leitor a observar o valor p sempre que possivel. 

Tamanho da amostra e testes de hipotese 

Em dados de pesquisa envolvendo centenas de observa£6es, a hipotese nula parece ser rejeitada 
com mais frequencia do que em amostras pequenas. Vale a pena citar aqui Angus Deaton: 

A medida que o tamanho da amostra cresce, e, desde que utilizemos um procedimento de estimajao 
consistente, nossas estimativas estarao proximas da verdade e menos dispersas ao redor dessa verdade 
para que as discrepancias que nao sao detectaveis com o tamanho da amostra pequena levem-nos a re- 
jeifao em amostras grandes. Amostras de tamanhos grandes assemelham-se ao grande poder resolutivo 
de um telescopio; caracteristicas que nao sao visiveis a uma certa distancia tomam-se mais e mais defini- 
damente delineadas a medida que acontece a magnificapao. 9 

Seguindo Learner e Schwarz, Deaton sugere ajustar os valores criticos padrao dos testes F e yfi 
como se segue: rejeitar a hipotese nula quando o valor F calculado exceder o logaritmo do tamanho 
da amostra, ou seja, In, e quando a estatistica y 2 calculada para a restrigao q exceder qln, em que l 
e o logaritmo natural e n e o tamanho da amostra. Esses valores criticos sao conhecidos como valo¬ 
res criticos Leamer-Schwarz. 

Utilizando o exemplo de Deaton, se n = 100, a hipotese nula seria rejeitada apenas se o valor F 
calculado fosse maior do que 4,6, porem, se n — 10.000, a hipotese nula seria rejeitada quando o 
valor F calculado excedesse 9,2. 


FIGURA A. 14 

Fun^ao da potencia 
do teste de hipotese 
/x = 50 quando 
N= 25, a = 10, e 
a = 0,05. 


Probabilidade de rejeitar H 



Escala de fj. 


9 Deaton, Angus. The analysis of household surveys: a microeconometric approach to development policy. Baltimore: 
The Johns Hopkins University Press, 2000. p. 1 30. 
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A abordagem do teste de significance 

Lembre-se de que 


X- /x 

°vv« 


N(0, 1 ) 


Em qualquer aplicagao dada, X e n sao conhecidos (ou podem ser estimados), contudo, os verda- 
deiros /x e a nao sao conhecidos. Porem, se a for especificado e considerarmos (fazendo uso da H 0 ) 
que fi = /x*, um valor numerico especifico, entao Z, podera ser diretamente calculado e poderemos 
facilmente observar a tabela de distribuigao normal para encontrar a probabilidade de obter o valor Z 
calculado. Se essa probabilidade for pequena, por exemplo, menor do que 5% ou 1%, poderemos 
rejeitar a hipotese nula — se a hipotese fosse verdadeira, as chances de obter o valor particular de Z 
deveriam ser muito altas. Essa e a ideia geral por atras da abordagem do teste de significancia para o 
teste de hipotese. A ideia central em questao e a estatfstica de teste (aqui a estatfstica Z) e sua distri¬ 
buigao de probabilidade sob o valor presumido de /x = /x*. Apropriadamente, neste caso, o teste e 
conhecido como teste Z, uma vez que utilizamos o valor Z (normal padronizado). 

Voltando ao nosso exemplo, se /x = n* — 69, a estatfstica Z torna-se 

X- /I 

2 = _ — 

o'/ yjn 

67- 69 

~ 2,5/yioo 


= - 2/0,25 = - 8 

Se observarmos a Tabela D.l, de distribuifao normal, podemos verificar que a probabilidade de 
obter tal valor de Z e extremamente pequena. (. Nota : a probabilidade de um valor Z exceder 3 ou —3 
e de aproximadamente 0,001. A probabilidade de Z exceder 8 e ainda menor.) Podemos rejeitar a hi¬ 
potese nula de que /x = 69; dado esse valor, a nossa chance de obter um X de 67 e extremamente 
pequena. Portanto, duvidamos que a nossa amostra venha da popula 5 ao com um valor medio de 69. 
Por meio do diagrama, a situa§ao e apresentada na Figura A. 15. 


FIGURA A.15 

A distribui§ao da 
estatfstica Z. 



Na linguagem do teste de significancia, quando dizemos que uma estatistica de teste e signifi- 
cativa, em geral queremos dizer que podemos rejeitar a hipotese nula. Considera-se que a estatfs¬ 
tica de teste e significativa se a probabilidade de obte-la for igual ou menor do que a, a 
probabilidade de cometer um erro do tipo I. Assim, sea = 0,05, sabemos que a probabilidade de 
obter um valor Z de —1,96 ou 1,96 e de 5% (ou de 2,5% em cada cauda da distribuigao normal pa- 
drao). Em nosso exemplo ilustrativo, Z era —8. Daf a probabilidade de obter tal valor de Z ser muito 
menor do que 2,5%, bem abaixo de nossa probabilidade pre-especificada de cometer um erro do tipo 
I. E por isso que o valor calculado de Z = — 8 e estatisticamente significativo; rejeitamos a hipotese 
nula de que o verdadeiro /x* seja 69. E claro, chegamos a mesma conclusao utilizando a abordagem 
do intervalo de confianga para o teste de hipotese. 
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Agora, vamos resumir os passos envolvidos no teste da hipotese estatistica: 

Passo 1. Formule a hipotese nula H 0 e a hipotese alternativa //, (por exemplo: H 0 : /x = 69 e 
H x . fi = 69). 

Passo 2. Selecione a estatistica de teste (por exemplo: X ). 

Passo 3. Determine a distribuifao de probabilidade da estatistica de teste (por exemplo: 

X ~ N( fj, a 2 / n). 

Passo 4. Escolha o nivel de significancia a (a probabilidade de cometer um erro do tipo I). 
Passo 5. Utilizando a distribui§ao de probabilidade da estatistica de teste, estabeleca um 
valor de confianpa 100(1 — «)%. Se o valor do parametro submetido a hipotese nula (por 
exemplo: /x = /x* = 69) estiver na regiao de confian 9 a, a regiao de aceitapao, nao rejeite a 
hipotese nula. Porem, se ele estiver fora desse intervalo (ou seja, dentro da regiao de rejei- 
£ao), pode-se rejeitar a hipotese nula. Tenha em mente que, ao nao rejeitar ou rejeitar uma 
hipotese nula, corre-se o risco de estar errado em uma porcentagem de a. 


Referencias 

Para mais detalhes do material tratado neste apendice, o leitor pode consultar as seguintes re¬ 
ferencias: 

HOEL, Paul G. Introduction to mathematical statistics. 4. ed. Nova York John Wiley & Sons, 1974. 

Este livro fornece uma introdugao bem simples a varios aspectos da estatistica matematica. 
FREUND, John E.; e WALPOLE, Ronald E. Mathematical statistics. 3. ed. Englewood Cliffs, NJ.: 

Prentice Hall, 1980. Outro livro introdutorio em estatistica matematica. 

MOOD, Alexander, M.; GRAYBILL, Franklin A.; BOE, Duane C. Introduction to the theory of statistics. 
3. ed.. Nova York: McGraw-Hill, 1974. Esta e uma introdu^ao abrangente da teoria estatistica, 
porem, e, de certa forma, mais diffcil do que os dois livros anteriores. 

NEWBOLD, Paul. Statistics for business and economics. Englewood Cliffs, NJ.: Prentice Hall, 1984. 
Uma introdu^ao nao matematica abrangente a estatistica com varios problemas solucionados. 




Rudimentos de 
algebra matricial 

Este apendice fornece o essencial sobre algebra matricial para a compreensao do Apendice C e de 
parte do conteudo do Capftulo 18. A discussao nao e rigorosa e nao sao dadas quaisquer demonstra- 
£oes. Para demonstra 5 oes e mais detalhes, o leitor pode consultar as references. 


B.l Defini^oes 


Matriz 

Uma matriz e um conjunto retangular de numeros ou elementos distribuidos em linhas e colunas. 
Mais precisamente, uma matriz de ordem ou dimensao M por N (escrita como M x N) e um conjun¬ 
to de M x N elementos distribuidos em M linhas e N colunas. Sendo assim, com as letras maiusculas 
em negrito indicando matrizes, uma matriz A (M x N) pode ser expressa como 



a li 

«12 

a 13 • 

«1 N 

A = [aij] = 

«21 

«22 

«23 

®2N 


. «M1 

a M2 

«M3 ‘ 

Qmn 


em que a t j e o elemento que aparece na i-esima linha e na y-esima coluna de A e [ai j] corresponde 
a uma expressao abreviada da matriz A cujo elemento essencial e aij. A ordem ou dimensao de 
uma matriz - o numero de linhas e colunas - e frequentemente escrita embaixo da matriz para 
facilitar a referenda. 


A = 

2x3 


2 3 
6 1 


5 

3 


B = 

3x3 


1 5 7 

-10 4 

8 9 11 


Escalar 

O escalar e um unico numero (real). Em outros termos, um escalar e uma matriz lxl. 

Vetor coluna 

Uma matriz constitufda de M linhas e apenas uma coluna e chamada vetor coluna. Empregando 
letras minusculas em negrito para denotar vetores, um exemplo de vetor coluna pode ser 


834 
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X = 
4x1 


3 

4 

5 
9 


Vetor linha 

Uma matriz que consiste em uma unica linha e N colunas e denominada vetor linha. 


x = [1 2 5 - 4] y = [0 5 -9 6 10] 

1x4 1x5 


Transposigao 

A transposigao de uma matriz A M x N, indicada por A / (que se le como “A linha” ou “A 
transposta”) e uma matriz N x M obtida por meio da troca das linhas pelas colunas de A; ou 
seja, a /-esima linha de A torna-se a /-esima coluna de A'. Por exemplo, 


A = 

3x2 


4 

3 

5 


5 

1 

0 


A' 

2x3 


4 3 

5 1 


5 

0 


Na medida em que um vetor e um tipo especial de matriz, a transposigao de um vetor linha e a 
transposigao de um vetor coluna e a transposigao de um vetor coluna e um vetor linha. Portanto, 


x = 


4 

5 

6 


e x' = [4 5 6] 


Seguiremos a convcncao de indicar os vetores linha com “linha” (‘). 

Submatriz 

Dada a matriz A (M x N), se todas as colunas e linhas de A forem eliminadas, com excegao das r 
linhas e ,v colunas, a matriz resultante da ordem r x ,v sera denominada submatriz de A. Sendo assim, 
se 


A = 

3x3 


3 5 7 
8 2 1 
3 2 1 


e se eliminarmos a terceira linha e a terceira coluna de A, obteremos 

R = T 3 5_ 

2x2 L 8 2 . 

que corresponde a uma submatriz de A cuja ordem e 2x2. 


B.2 Tipos de matrizes 


Matriz quadrada 

Uma matriz que possui o mesmo numero de linhas e colunas e denominada matriz quadrada. 
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A = 


3 

5 


4 

6 


B 


8 

1 

0 


Matriz diagonal 

Uma matriz quadrada que possua pelo menos um elemento diferente de zero na diagonal principal 
(do canto superior esquerdo ao canto inferior direito) e possua zeros nas demais poshjoes sera chama- 

da de matriz diagonal. 


A = 

2x2 


2 

0 


0 

3 


B = 

3x3 


-2 0 0 
0 5 0 
0 0 1 


Matriz escalar 

Uma matriz diagonal cujos elementos diagonals sao todos iguais e designada matriz escalar. Um 
exemplo e a matriz de variancia-covariancia de um termo de erro populacional do modelo classico de 
regressao linear dado na Equaijao (C.2.3), ou seja. 


var-cov(u) = 


'cr 2 0 0 0 0" 

0 a 2 0 0 0 

0 0 ct 2 0 0 

0 0 0 cr 2 0 

0 0 0 0 cr 2 


Matriz identidade ou unidade 

Uma matriz diagonal cujos elementos diagonals sao todos 1 e chamada matriz identidade ou 
unidade e e denotada por I. Esse e um tipo especial de matriz escalar. 


" 1 

0 

0 

1 

O O 

I = 

’ i 

0 

0 

1 

0 

0 

1- 

O O 

_0 

0 

l _ 

4x4 

0 

0 

1 

0 




. 0 

0 

0 

1. 


Matriz simetrica 

Uma matriz quadrada cujos elementos acima da diagonal principal sao imagens espelhadas dos 
elementos que estao abaixo da diagonal principal e chamada de matriz simetrica. Em outros termos, 
uma matriz simetrica corresponde aquela cuja transpos^ao e igual a si mesma; ou seja, A = A'. Ou 
entao, o elemento aij de A e igual ao elemento aj\ de A'. Um exemplo e a matriz de variancia-cova¬ 
riancia dado na Equacjao (C.2.2). Outro e a matriz de correlagao apresentada em (C.5.1). 

Matriz nula 

Uma matriz cujos elementos sao todos zero e chamada matriz nula e e denotada por 0. 

Vetor nulo 

Uma linha ou coluna cujos elementos sao todos zero e designada vetor nulo e tambem e denota¬ 
da por 0. 
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Matrizes iguais 

Duas matrizes A e B denominam-se iguais se sao da mesma ordem e seus elementos correspon- 
dentes sao iguais; isto e, a t j = b ,y para todos os i e j. Por exemplo, as matrizes 


A = 

3x3 


3 

4 

5" 



3 

4 

5 ’ 

0 

-1 

2 

e 

B = 

3x3 

0 

-1 

2 

5 

1 

3 


5 

1 

3 


sao iguais, ou seja A = B. 

B.3 Operates com matrizes 


Soma de matrizes 

Sendo A = [ a, ; ] c B = [ b t) ]. Se A c B forem da mesma ordem, definiremos a soma das matrizes 
como 


A+B = C 


em que C e da mesma ordem de A e B e sao obtidas por meio de c ;j - = a,j + bj j para todos os i e /; C 
e obtida pela adi§ao dos elementos correspondentes de A e B. Se essa adi£ao pode ser efetuada, po- 
demos afirmar que A e B sao conformes para adi§ao. Por exemplo, se 


3 8 

9 14 

Subtra^ao de matrizes 

A subtragao de matrizes segue o mesmo princfpio da adiyao, exceto pelo fato de que C = A — B; 
ou seja, subtrafmos os elementos de B dos elementos correspondentes de A para obtermos C, desde 
que A e B sejam da mesma ordem. 

Multiplica^ao escalar 

Para multiplicar uma matriz A por um escalar X (um numero real), multiplicamos cada elemento 
da matriz por X: 


A = 


2 3 4 5 
6 7 8 9 


e C = A + B, entao 


3 3 

4 7 


Por exemplo, se X — 2 e 


entao, 


XA = [Xa,j] 



5 

7 


XA = 


-6 

16 


10 

14 
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Multiplica^ao de matrizes 

Consideremos A como M x N e B como N x P. O produto AB (nesta ordem) e definido como 
uma nova matriz C de ordem M x P de modo que: 


— 'y ^ Qikbi 


'kj 


k= 1 


i = 1,2 

j= 1,2,..., P 


Isto e, o elemento na i-esima linha e na j-esima coluna de C e obtido por meio da multiplica 5 ao dos 
elementos da i-esima linha de A pelos elementos correspondentes da j-esima coluna de B e por meio 
da adi£ao de todos os termos; tal procedimento e conhecido como regra da multiplica^ao linha por 
coluna. Para obtermos c n , que corresponde ao elemento na primeira linha e a primeira coluna de C, 
multiplicamos os elementos da primeira linha de A pelos elementos correspondentes na primeira coluna 
deB e somamos todos os termos. De modo semelhante, para obtermos C\ 2 , multiplicamos os elementos 
que estao na primeira linha de A pelos elementos correspondentes que estao na segunda coluna de B e 
somamos todos os termos e assim em diante. 

Observe que, para que a multiplica 5 ao exista, as matrizes A e B devem conformar-se em relagao a 
multiplica§ao; o numero de colunas em A deve ser igual ao numero de linhas em B. Se, por exemplo. 


A = 

2x3 


3 

5 


4 

6 


7 

1 


e 


B = 

3x2 


2 1 
3 5 
6 2 


AB = C = 

2x2 


(3 x 2) + (4 x 3) + (7 x 6) 
(5 x 2) + (6 x 3) + (1 x 6) 


(3 x 1)+ (4x 5)+ (7x 2) 
(5 x 1)+ (6x 5)+ (1 x 2) 


60 37 
34 37 


Mas se 



4 7 
6 1 


B= ^ l 

2x2 5 6 


o produto de AB nao e definido, na medida em que A e B nao sao conformes a multiplicagao. 


Propriedades da multiplica^ao de matrizes 

1. A multiplica 5 ao de matrizes nao e necessariamente comutativa; em geral AB j BA. Portan- 
to, a ordem em que as matrizes sao multiplicadas e muito importante. AB significa que A e 
pos-multiplicada por BouBe pre-multiplicada por A. 

2. Ainda que AB e BA existam, as matrizes resultantes podem nao ser de mesma ordem. As¬ 
sim, seAeMxAfeBeiVxM, AB e M x M enquanto BA 6N x Ns, por conseguinte, de 
ordens diferentes. 


3. Ainda que A e B sejam matrizes quadradas, de modo que AB e BA sejam ambas definidas, 
as matrizes resultantes nao serao necessariamente iguais. Por exemplo, se 


A = 


4 

3 


7 

2 


e B = 


1 

6 


5 

8 


entao, 



76 

31 


e BA = 


19 

48 


17 

58 


e AB BA. Um exemplo de AB = BA ocorre quando tanto A quanto B sao matrizes identi- 
dade. 
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4. Um vetor linha pos-multiplicado por um vetor coluna e um escalar. Desse modo, considere- 
mos os resfduos dos mmimos quadrados ordinarios u,\, u 2 , ■ ■ ■ , u„ ■ Se u' for um vetor coluna 
e u' for um vetor linha, teremos 


U'U = [ll\ U 2 «3 


U\ 

u 2 

u-i 


Ufi 

= u\ + u\ + u\ +-hi/' 2 

= um escalar [veja a Equa 5 ao (C.3.5)] 


5. Um vetor coluna pos-multiplicado por um vetor linha e uma matriz. Como exemplo, consi- 
dere os termos de erro de popula§ao no modelo classico de regressao linear, ou seja, tq, u 2 , 
. . . , u n . Se u for um vetor coluna e u' um vetor linha, obteremos 



U\ 





u 2 




uu' = 

U7, 

[u\ u 2 

Ui 

U n \ 


_ Un _ 





u\ 

U\U2 

U\U2 

• U 1 U n 

= 

U 2 U 

4/ 2 

1 m 2 

U 2 U 2 

• U2U n 


U n U\ U n U2 

U n U 3 

■ u 2 

n 


que e uma matriz de ordem n x n. Observe que a matriz anterior e simetrica. 

6. Uma matriz pos-multiplicada por um vetor coluna e um vetor coluna. 

7. Um vetor linha pos-multiplicado por uma matriz e um vetor linha. 

8. A multiplica^'ao de matrizes e associativa', (AB)C = A(BC), em que AeMx N, B6N x P 
e C e P x K. 

9. A multiplicayao de matrizes e distributiva em relayao a adigao; A(B + C) = AB + AC e 
(B + C) A = BA + CA. 

Transposi^ao de matrizes 

Ja definimos o processo de transposicjao de matrizes como o intercambio de linhas e colunas de 
uma matriz (ou um vetor). Vamos expor agora algumas das propriedades da transpos^ao. 

1. A transposi 5 ao de uma matriz transposta e a propria matriz original. Assim, (A'/ = A. 

2. Se A e B sao conformes para a adi 9 ao, entao C = A+ BeC' = (A+ B)' = A' + B'. A 
transpos^ao da soma de duas matrizes e a soma de suas transpos^oes. 

3. Se AB e definida, (AB)' = B'A'. A transposi 9 ao do produto de duas matrizes e o produto de 
suas transposhjoes na ordem inversa. Isso pode ser generalizado: ( ABCD)' = D'C'B'A'. 

4. A transposi 9 ao de uma matriz identidade I corresponde a propria matriz identidade; I' = I. 

5. A transpos^ao de um escalar e o proprio escalar. Assim, se a e um escalar. A/ = A. 

6 . A transpos^ao de (AA)' e AA' em que A e um escalar. [Observe: (AA)' = A'A' = A'A = 
AA'.] 
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7. Se A e uma matriz quadrada de modo que A = A', entao A e uma matriz simetrica. (Veja a 
defini^ao de matriz simetrica na Sec^ao B.2.) 

Inversao de matrizes 

A in versa de uma matriz quadrada A, denotada por A -1 (lida como “A in versa”), se existir, e uma 
unica matriz quadrada, de modo que 


AA“ 1 = A _1 A = I 

em que I e uma matriz identidade cuja ordem e a mesma de A. Por exemplo, 


"2 

4" 

A" 1 = 

1 

1 " 

2 

AA“ 1 = 

'1 

O' 

6 

8 


6 

1 

0 

1 




8 

4 _ 





Veremos como A 1 e calculado depois de estudarmos o topico dos determinantes. Enquanto isso, 
observe as seguintes propriedades da matriz inversa: 

1. (ABr 1 = B -1 A -1 ; ou seja, a inversa do produto de duas matrizes e o produto de suas inversas 
na ordem inversa. 

2. (A -1 ) = (A') -1 ; ou seja, a transposiyao de A inversa e a inversa de A transposta. 

B.4 Determinantes 

Para cada matriz quadrada, A corresponde um numero (escalar) conhecido como o determinantes 
da matriz, que e denotado por det A ou pelo sfmbolo IA|, em que | | significa “o determinante de”. 

Observe que a matriz por si nao possui qualquer valor numerico, mas o determinante de uma matriz 
e um numero. 


A = 

1 3 

2 5 

-7 

0 

| A | = 

1 3 

2 5 

-7 

0 


3 8 

6 


3 8 

6 


O IAI neste exemplo e chamado de determinante de ordem 3 por ser associado a uma matriz de 
ordem 3x3. 

Avalia^ao de um determinante 

O processo de encontrar o valor de um determinante e conhecido como avaliagao, expansao ou 
redu?ao do determinante. Isso e feito ao manipular as entradas da matriz de uma forma bem defini- 
da. 

Avaliagao de um determinante 2x2 
Se 

«12 
«22 


- 011022 _ 012^21 

que e obtido pela multiplica 5 ao cruzada dos elementos na diagonal principal e subtraindo desse produ¬ 
to a multiplica 5 ao cruzada dos elementos na outra diagonal da matriz A, como indicado pelas setas. 


A = 

seu determinante e avaliado como se segue: 

I A I = 


a ii 
«21 


«n « 12 
#21 ^>#22 
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EXEMPLO 1 


Avalicigao de um determinante 3x3 
Se 

A = 


an 

fll2 

013 

«21 

^22 

023 

^31 

032 

033 


entao 


A | — 011022033 ~ 011023032 + «12«23^31 — 012021033 + 013021 fl 32 — 013022031 


Um exame cuidadoso da avalia£ao do determinante 3x3 demonstra que: 

1. Cada termo na expansao do determinante content um e apenas um elemento de cada linha e 
de cada coluna. 

2. O numero de elementos em cada termo e o mesmo do numero de linhas (ou colunas) na 
matriz. Portanto, um determinante 2x2 possui dois elementos em cada termo de sua expan¬ 
sao, um determinante 3x3 possui tres elementos em cada termo de sua expansao e assim 
por diante. 

3. Os termos na expansao alternam-se em sinal de + para —. 

4. Um determinante 2x2 possui dois termos em sua expansao e um determinante 3x3 possui 
seis termos. A regra geral e: o determinante de ordem N x N possui N\ = N(N — I )(N — 2) 
• • • 3 ■ 2 ■ 1 termos em sua expansao, em que N\ le-se “fatorial de N”. Seguindo essa regra, 
um determinante de ordem 5x5 possuira 5 • 4 • 3 ■ 2 ■ 1 = 120 termos em sua expansao. 1 


Propriedades dos determinantes 

1. Uma matriz cujo valor do deteminante e zero e chamada de matriz singular, enquanto 
uma matriz com um determinante nao zero e chamada de matriz nao singular. O inverso 
de uma matriz, como anteriormente definido, nao existe para uma matriz singular. 

2. Se todos os elementos de toda linha de A forem zero, seu determinante sera zero. Assim, 


I AI = 


0 0 0 
3 4 5 
6 7 8 


= 0 


3. IA'I = IAI; isto e, os determinantes de A e da transposta A sao os mesmos. 

4. Intercambiando quaisquer das duas linhas ou das duas colunas de uma matriz A, modifica-se 
o sinal de IAI. 


SE 


6 9 
■1 4 


B = 


-1 4 
6 9 


em que B e obtido intercambiando das linhas de A, entao 

e 


IAI = 24 - (- 9) 
= 33 


IBI =- 9- (24) 
= -33 


5. Se cada elemento de uma linha ou de uma coluna de A for multiplicado por um escalar X, 
entao IAI e multiplicado por X. 


1 Para avaliar o determinante de uma matriz N x N, A, veja as references. 
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EXEMPLO 2 SE 


e multiplicarmos a primeira linha de A por 5 para obter 

„ f 25 -401 


podemos verificar que |A| = 36 e |B| = 180, que e 5 |A|. 


A = 


6 9 
-1 4 


6 . Se duas linhas ou colunas de uma matriz forem identicas, seu determinante sera zero. 

7. Se uma linha ou uma coluna de uma matriz for multipla de outra linha ou coluna daquela 
matriz, seu determinante sera zero. Assim, se 


em que a primeira linha de A e duas vezes a segunda linha, IAI = 0. De maneira geral, se 
qualquer linha (coluna) de uma matriz for uma combinayao linear de outras linhas (colunas), 
seu determinante sera zero. 

8 . IAB| = IAMBI; o determinante do produto de duas matrizes e o produto dos seus determinan- 
tes (individuais). 

Posto de uma matriz 

O posto de uma matriz e a ordem da maior submatriz quadrada cujo determinante nao e zero. 


EXEMPLO 3 l" 3 6 6 

A= 0 4 5 

.3 2 1. 

Pode-se verificar que |A| = 0. Em outras palavras, A e uma matriz singular. Embora sua ordem 
seja 3x3, seu posto e menor do que 3. Na verdade, ele e 2, porque podemos encontrar uma 
submatriz 2x2 cujo determinante nao e zero. Por exemplo, se exclufmos a primeira linha e 
a primeira coluna de A, obtemos 


cujo determinante e —6, que e nao zero. Portanto, o posto de A e 2. Como anteriormente 
observado, o inverso de uma matriz singular nao existe. Para uma matriz A de origem N x N, 
seu posto tern de ser N para que a sua inversa exista; se seu posto for menor do que N, A sera 
singular. 


Menor 

Se a /-esima linha e a /-esima coluna de uma matriz A de origem N x N sao exclufdas, o determi¬ 
nante da submatriz resultante e chamado de o menor do elemento a !; (o elemento na interse 5 ao da 
/-esima linha e a /-esima coluna) e e denotado por IM, ; I. 
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EXEMPLO 4 


Oil 

012 

013 

021 

022 

0 23 

0 3 l 

032 

033. 


O menor de a u e 


I Mnl 


0 22 

023 

032 

033 


022033 - 023032 


De forma semelhante, o menor de o 21 e 


IM 2 iI 


012 

013 

032 

033 


012033 - 0 13 0 3 2 


Os menores de outros elementos de A podem ser encontrados de maneira parecida. 


Cofator 

O cofator do elemento a /( de uma matriz A de origem N x N, denotado por c i( , e definido como: 

ctj = (-ly^'iMiji 


Em outras palavras, um cofator e um menor sinalizado: com sinal positivo se i + j for par e ne- 
gativo se i + j for fmpar. Assim, o cofator do elemento a n da matriz A 3 x 3 anteriormente dada 
e a 21 cii 3 — o 23 a 32 , enquanto o cofator do elemento a 2] e —(a l2 a 33 — a u a 32 ), uma vez que a soma dos 
subscritos 2 e 1 e 3, que e um numero fmpar. 

Matriz de cofator 

Substituindo os elementos a, , de uma matriz A pelos seus cofatores, obtemos uma matriz conhe- 
cida como matriz de cofator de A, denotada por (cof A). 

Matriz adjunta 

A matriz adjunta, escrita como (adj A), e a transposta da matriz de cofator; (adj A) = (cof A)'. 


B.5 Encontrando a inversa de uma matriz quadrada 

Se A e quadrada e nao singular (IA| f 0), a sua inversa A -1 pode ser encontrada da seguinte 
forma: 


A" 1 = ^(adjA) 

I A | 

Os passos envolvidos no calculo sao os seguintes: 

1. Descubra o determinante de A. Se nao for zero, execute o passo 2. 

2. Substitua cada elemento a tj de A por seu cofator para obter a matriz de cofator. 

3. Transponha a matriz de cofator para obter a matriz adjunta. 

4. Divida cada elemento da matriz adjunta por IAI. 
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EXEMPLO 5 

Descubra a 
inverzsa da 
matriz 


A = 


1 

5 

2 


2 3 
7 4 
1 3 


Passo 1. Primeiro, descobrimos o determinante da matriz. Aplicando as regras de expansao 
de um determinante 3x3 dado previamente, obtemos |A| = —24. 

Passo 2. Agora obtemos a matriz de cofator, por exemplo, C: 


1 7 

41 15 

41 15 

7 

11 

3 | | 2 

3 2 

1 

12 

3 1 11 

3 1 11 

2 

11 

3 | | 2 

3 | | 2 

1 

12 

3 1 11 

3 1 11 

2 

| 7 

4 | | 5 

41 5 

7 

17 

-7 -9 



-3 

-3 3 



-13 

11 -3 




Passo 3. Transpondo a matriz de cofator anterior, obtemos a seguinte matriz adjunta: 


(adj A) = 


17 -3 -13 
-7 -3 11 

-9 3 -3. 


Passo 4. Agora dividimos os elementos de (adj A) pelo valor do determinante obtido, —24, 
para obter 


A 


l 


1 17 -3 -13 



17 

3 

13 

24 

24 

24 

7 

3 

11 

24 

24 

24 

9 

3 

3 

24 

24 

24 


Podemos facilmente verificar que 


AA 1 = 


1 0 0 
0 1 0 
0 0 1 


que e uma matriz identidade. O leitor deve verificar que, para o exemplo ilustrativo dado no 
Apendice C (veja a Segao C.10), a inversa da matriz X'X e semelhante a demonstrada na 
Equagao (C.10.5). 


B.6 Diferencia^ao matricial 


Para seguirmos o material no Apendice CA, Segao CA.2, precisamos considerar algumas regras 
da diferenciagao matricial. 
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REGRA 1 Se a' = [a, a 2 ■■■ a„] e um vetor linha de numeros e 


e um vetor coluna das variaveis x,, x 2/ 


*i 

*2 


. x n _ 


. ., x„, entao 


9(a'x) 

~Hx~ 


a i 
«2 


a 


n 


REGRA 2 


Considere a matriz x'Ax tal que 


Entao 




Oil 

012 ' 

■ Oin 

x'Ax = [xi X 2 

X n] 

021 

022 ' 

02 n 



-0„1 

0 n 2 

Onn 


9(x ' Ax) = 2Ax 
9x 

que e um vetor coluna de n elementos, ou 

9(xAx) = 2x 'A 
9x 

que e um vetor linha de n elementos. 


Referencias 

CHIANG, Alpha C. Fundamental methods of mathematical economics. 3. ed. Nova York: McGraw-Hill, 1984, caps. 

4 e 5. A obra apresenta uma discussao avar^ada sobre algebra linear. 

HADLEY, G. Linear algebra. Reading, Mass.: Addison-Wesley, 1961. A obra apresenta uma discussao avan^ada. 



















Apendice 

A abordagem matricial 
para o modelo de regressao 
linear 

Este apendice apresenta o modelo classico de regressao linear envolvendo k variaveis (Y e X 2 , 
X 2 , , X k ) da notagao de algebra matricial. Conceitualmente, o modelo de k variaveis e uma exten- 

sao logica dos modelos de duas e tres variaveis considerados neste livro. Portanto, o apendice apre¬ 
senta poucos conceitos novos, com excegao da notagao em matrizes. 1 

Uma grande vantagem da algebra matricial sobre a algebra escalar (algebra elementar que lida 
com escalas ou numeros reais) e que ela fornece um metodo compacto para tratar dos modelos de 
regressao envolvendo qualquer numero de variaveis; uma vez que o modelo de k variaveis e formu- 
lado e solucionado na notagao em matrizes, a solugao aplica-se a uma, duas, tres ou a qualquer nume¬ 
ro de variaveis. 



C.l O modelo de regressao linear com k variaveis 

Se generalizarmos os modelos de regressao linear de duas e tres variaveis, o modelo da fungao de 
regressao populacional (FRP) de k variaveis, envolvendo a variavel dependente Ye k — 1 variaveis 
explanatorias X 2 , X 3 ,..., X h podera ser escrito como 

FRP: Y t = ft i + p 2 X 2 i + P 3 X 3 i + • • ■ + fi k X ki + ut i = 1, 2, 3,..., n (C.1.1) 

em que = intercepto, f J > 2 ate /!/. = coeficientes angulares parciais, u — observagao de /-esima 
perturbagao estocastica e n e o tamanho da populagao. O modelo FRP (C.1.1) deve ser interpre- 
tado da maneira habitual: ele nos fornece a media ou 0 valor esperado de Y condicionado aos va- 
lores fixos (em amostras repetidas) de X 2 , X 2 , ..., X k , isto e, E(Y I X 2i , X 2i , ..., X ki ). 

A Equagao (C. 1.1) e uma expressao abreviada para o seguinte conjunto de n equagoes simultaneas: 

Fi = + P 2 X 21 + +-1- p k X k i + u\ 


I2 - / 3 i + P2X22 + P3X32 + — faXia + u 2 


(C.l.2) 


Y„ — Pi + PiX 2n + @ 3 X 3 ,, + -1- fi k X kn + u n 


846 


1 Leitores nao familiarizados com a algebra matricial devem rever o Apendice B antes de seguirem adiante. O 
Apendice B fornece o essencial da algebra matricial necessario para acompanhar este apendice. 
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Escrevamos o sistema de equapoes (C.1.2) de um modo alternative, porem esclarecedor: 2 


Yi 


1 

X 2 i 

X 31 ■■■ 

Xn 


Pi 


U\ 

y 2 

= 

1 

X 22 

X 32 ■■■ 

x k2 


P 2 

+ 

U 2 

_ Y n _ 


_ 1 

X 2n 

X 2n 

X-kn _ 


. Pk. 


u n _ 

y 

= 



X 



P 

+ 

u 

X 1 




n x k 


k x 1 

n x 1 


(C.1.3) 


em que y = vetor coluna n x 1 de observa 5 oes da variavel dependente Y 

X = matriz n x k dando n observa 5 oes das k — 1 variaveis de X 2 a X k , a primeira coluna toda 
de 1 representando o termo de intercepto (essa matriz e tambem conhecida como matriz 
dos dados) 

P = vetor coluna k x 1 de parametros desconhecidos /? b p 2 , ■ ■ • , Pk 
u = vetor coluna n x 1 de n termos de erro u, 

Ao utilizar as regras da multiplicapao e da soma de matrizes, o leitor deve verificar que os siste- 
mas (C.1.2) e (C.1.3) sao equivalentes. O sistema (C.1.3) e conhecido como representagao matricial 
de modelo geral de regressao linear com k variaveis. Ele pode ser escrito de modo mais compacto 
como: 


y 

flX 1 


X P + u 

n x k kx 1 « x 1 


(C.1.4) 


em que nao ha confusao acerca das dimensoes ou ordens da matriz X e dos vetores y, P e u; a Equa§ao 
(C.1.4) pode ser escrita como: 


y = XP+ u 


(C.1.5) 


Para ilustrar a representa 5 ao matricial, considere o modelo de duas variaveis, renda e consumo, 
tratado no Capltulo 3, }' = fi\ + Xj + it,, em que Yea despesa com consumo elea renda. 
Utilizando os dados fornecidos na Tabela 3.2, podemos escrever a formulagao matricial como: 


70 " 


■ 1 

80" 


U\ 

65 


1 

100 


U 2 

90 


1 

120 


U 3 

95 


1 

140 


U 4 

110 

= 

1 

160 


'Pi 

+ 

Us 

115 


1 

180 


P 2 


U 6 

120 


1 

200 


Uj 

140 


1 

220 


Us 

155 


1 

240 


W 9 

_ 150 _ 


1 

260 _ 


_ M 10 _ 

y 

= 


X 

P 

+ 

u 

10 X 1 

10x2 

2 x 1 

10 x 1 


Como nos casos de duas e tres variaveis, nosso objetivo e estimar os parametros da regressao 
multipla (C.1.1) e extrair inferencias sobre elas com base nos dados que temos em maos. Na nota§ao 
matricial, isso equivale a estimar P e extrair inferencias sobre esse p. Para o proposito da estima§ao, 


2 Seguindo a notagao introduzida no Apendice B, representamos os vetores por letras minusculas em negrito e 
as matrizes por letras maiusculas em negrito. 
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podemos utilizar o metodo dos mmirnos quadrados ordinarios (MQO) ou o metodo da maxima ve- 
rossimilhanga (MV). Mas, como observado anteriormente, esses dois metodos resultam em estimati- 
vas identicas para os coeficientes de regressao. 3 Portanto, deveremos limitar nossa atcncao ao metodo 
dos MQO. 


C.2 


Hipoteses do modelo de regressao linear classico em nota^ao 
matricial 


As hipoteses subjacentes ao modelo classico de regressao linear estao na Tabela C.l; elas 
sao apresentadas tanto na notagao escalar como na notagao matricial. A hipotese 1 dada na 
Equagao (C.2.1) indica que o valor esperado do vetor de disturbio u, isto e, de cada um de seus ele- 
mentos, e zero. Mais explicitamente, E( u) = 0 significa 


U\ 


E(ui ) 


o" 

u 2 

= 

E(u 2 ) 

= 

0 

. U n_ 


E(Un) _ 


0 


(C.2.1) 


A hipotese 2 (Equate* (C.2.2)) e uma maneira compacta de expressar as duas hipoteses apresen¬ 
tadas nas Equa 9 oes (3.2.5) e (3.2.2) pela notagao escalar. Para verificarmos isso, podemos escrever: 


u i 


£(uu') = E 


U 2 


[U\ U 2 


Un\ 


U 


n - 


TABELA C.l 

Hipotese do 
modelo classico 

Notafao escalar 

1. £ (u,) =0, 

para cada / 

(3.2.1) 

Notagao matricial 

1 . £(u) = 0 em que u e 0 sao n x 1 vetores 

de regressao 
linear. 

2. E(UjUj) = 0 


(3.2.5) 

coluna, sendo 0 um vetor nulo 

2. £(uu') = a 2 ! em que 1 e uma matriz 


= o 2 i = j 

(3.2.2) 

identidade n x n 

3. X 2 , X 3/ . . ., X k sao nao estocasticas 

3. A matriz X n x ke nao estocastica; consiste 

ou fixas 


em um conjunto de numeros fixos 

4. Nao ha rela^ao linear exata entre 

4. O posto de X e p(X) = k, em que ke o 

as variaveis X; nao ha 

(7.1.9) 

numero de colunas em X e k e menor do que 

multicolinearidade 


o numero de observagoes, n 

5. Para o teste de hipotese, 


5. O vetor u possui uma distribuifao normal 

Uj ~ N(0, a 2 ) 

(4.2.4) 

multivariada, ou seja, u ~ N( 0, cr 2 !) 


em que u' e a transposta do vetor coluna u, ou um vetor linha. Por meio da multiplica 5 ao, obtemos 


£'(uu') = E 

u\ 

U 2 U\ 

U\U 2 •• 

u\ 

* U\ u n 

U 2 U n 


_ U n ll\ 

U n U 2 

u l - 


3 A prova disso, no caso de k variaveis, pode ser encontrada na nota de rodape do Capftulo 4. 
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Aplicando o operador de expectativas E para cada elemento da matriz anterior, obtemos 


£(uu') = 

E ( u i) 

E{u 2 u\) 

E(u\U2 ) • 

E (li 2 2 ) ■ 

■ E(uiu n ) 

■ E(U2U„ ) 


E(u„u\) 

E(u n u 2 ) ■ 

• E ( U D . 


Devido as premissas de homocedasticidade e de nenhuma correlagao serial, a matriz (C.2.2) re- 
duz-se a 


il(uu') = 

‘a 2 

0 

0 

a 2 

0 •• 
0 

• 0 

■ 0 


_ 0 

0 

0 

■ CT 2 



' 1 

0 

0 •• 

■ o' 

= rr 2 

0 

1 

0 

• 0 



0 

0 

0 

• 1 


= <t 2 I 


em que I e uma matriz identidade n x n. 

A matriz (C.2.2) (e sua representagao na Equagao (C.2.3)) e denominada matriz de variancia e 
covariancia dos distiirbios de u{, os elementos na diagonal principal dessa matriz (do canto superior 
esquerdo ao canto inferior direito) fornecem as variancias, e os elementos fora da diagonal principal 
fornecem as covariancias. 4 Observe que a matriz de variancia e covariancia e simetrica: os elemen¬ 
tos acima e abaixo da diagonal principal sao reflexos uns dos outros. 

A hipotese 3 na Tabela C. 1 estabelece que a matriz X n x k e nao estocastica; consiste em nume- 
ros fixos. Como anteriormente observado, nossa analise de regressao e condicional aos valores fixos 
das variaveis X. 

A hipotese 4 estabelece que a matriz X possui posto pleno em colunas igual a k, o numero de 
colunas na matriz. Isso significa que as colunas da matriz X sao linearmente independentes; nao ha 
relagao linear exata entre as variaveis X. Em outras palavras, nao ha multicolinearidade. Na notagao 
escalar isso equivale a dizer que nao existe um conjunto de numeros '/, 1, ).2, . . . , kk que nao sejam 
todos zero, de modo que (conforme a Equagao (7.1.8)) 

XiXn + X 2 X 2 i +—l- A .*Xki = 0 (C.2.4) 

em que X u = 1 para todo i (considerando a coluna de 1 na matriz X). Em notagao matricial, a Equagao 
(C.2.4) pode ser representado como 


Vx = 0 (C.2.5) 

em que X’ e um vetor linha 1 x k e x e um vetor coluna 1x1. 

Se uma relagao linear exata tal como a Equagao (C.2.4) existe, diz-se que as variaveis sao colinea- 
res. Se, por outro lado, a Equagao (C.2.4) e verdadeira apenas se 7., = a 2 = A 3 = ■■■ = (), diz-se que as 
variaveis X sao linearmente independentes. Uma razao intuitiva para a hipotese da nao multicolinea¬ 
ridade foi apresentada no Capftulo 7 e desenvolvida tambem no Capftulo 10. 


4 Por definigao, a variancia de iv,=£[r/; — £(u,)] 2 e a covariancia entre u , e Uj= £[u,— £(u f )] [Uj-E(uj)]. Porem, devido 
a hipotese £(u ; ) = 0 para cada i, temos a matriz de variancia e covariancia (C.2.3). 
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C.3 Estimativa por mmimos quadrados ordinarios (MQO) 

Para obtermos uma estimativa MQO de (3, vamos primeiro escrever a fungao de regressao amos- 
tral de k variaveis: 


Yi — P i + P 2 X 2i + PiX 2i + ■ • • + faXkt + Ui 


(C.3.1) 


que pode ser escrita de forma mais compacta em notagao matricial como 

y = XP+ u 

e em forma de matriz como 


Yi' 


1 X 2 \ 

*31 ■ 

• x tl ] 


' py 


Ml 

y 2 

= 

1 ^22 

Xi2 ' 

■ X k2 


Pi 

+ 

ii 2 

Y„_ 


.1 x 2 „ 

X 2n ■ 

X-kn. 


- Pk- 


- Un - 


y X p + u 

wxl nx k kx 1 nx 1 


(C.3.2) 


(C.3.3) 


em que p e um vetor coluna de k elementos dos estimadores MQO dos coeficientes de regressao e 
u e um vetor coluna nx 1 de n resfduos. 

Como nos modelos de duas e tres variaveis, no caso de k variaveis os estimadores de MQO 
sao obtidos ao minimizar 


- A - PiXi, - PkXkif 


(C.3.4) 


em que ^uf e a soma dos quadrados dos resfduos (SQR). Na notagao matricial, isso corresponde a 
minimizar u' u, na medida em que: 


u'fl = [f^ «2 


n n ] 


Ml 

U 2 


a 2 a 2 

— Wj + U 2 + 


+ U 


Y.* 


Agora, a partir da Equagao (C.3.2), obtemos: 

u = y- Xp 


(C.3.5) 


(C.3.6) 


Portanto, 

u'u= (y- xp)'(y- xp) 

= y'y-2p'X'y+ P'X'xp (C3 ' 7) 

em que e feito uso das propriedades de transposigao de uma matriz, ou sej a, (X p)' = p'X e, pelo fato 
de P'X'y ser um escalar (um numero real), e igual a sua transposta y'X p. 

A Equagao (C.3.7) e a representagao matricial de (C.3.4). Na notagao escalar, o metodo dos MQO 
consiste em estimar Pi, @ 2 , ■ ■ ■, Pk de maneira que ^ m j seja o menor possfvel. Isso e realizado ao 
diferenciarmos (C.3.4) parcialmente com relagao a p u p 2 , • • •, Pt & ao igualarmos a zero as expressoes 
resultantes. Esse processo gera k equagoes simultaneas com k incognitas, as equagoes normais da 
teoria dos mmimos quadrados. Conforme apresentado no Apendice CA, Segao CA.l, essas equagoes 
sao da seguinte maneira: 
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nfo + + h J2 X * + ■••+ = E 7 - 

A X * + ft X 2< + ft J2 X * X * + • • ■ + X *‘ X *‘ = J2 X2i Y ‘ (C.B.8) 5 

ft X 2i + ft X 2i X 2i + ft Eii + • • ■ + ft EZ X 3i Xki = ^ 3l 7 ‘ 

ft £ ** + ft I] X ki X 2i + ft X] X ki X 2i + ■ • • + PkJ2 X li=H Xki Y ‘ 


Na forma matricial, a Equagao (C.3.8) pode ser representada como 


n 

E X 2 i 

E 

E^2, 

EEL 

E x 2 iX 2i 

E X'ii 

E x 2i 

E4, 

EEw 

T.x ki x 2i 

E Xfa X 2 i 


(X'X) 


Ex 2l x ki 

Y,XiiX ki 


H x l \ 


ft' 


1 

l 

1 

ft 


X 2 i 

x 22 

X 2n 

ft 

— 

x 3l 

Xj 2 

X 3n 

ft. 


_x k , 

X k2 

Xkn m 


x 


ft 
ft 
ft 

ftJ 
y 

(C.3.9) 


ou, de modo mais compacto, como 

(X'X)p = X'y 


(C.3.10) 


Observe estas caracteristicas da matriz (X'X): (1) ela oferece as somas brutas e os produtos cru¬ 
zados das variaveis X, e uma delas e o termo de intercepto que assume o valor 1 para cada observa- 
gao. Os elementos da diagonal principal fornecem as somas brutas dos quadrados e os elementos que 
estao fora da diagonal principal oferecem as somas brutas dos produtos cruzados (por brutas nos re- 
ferimos as variaveis que estao nas unidades de medida originiais); (2) ela e simetrica, visto que o 
produto cruzado entre X 2l e X 3 , e o mesmo que entre X 3) e X 2 i, (3) ela e da ordem ( k x k), ou seja, 
possui k linhas e k colunas. 

Na Equagao (C.3.10) as quantidades conhecidas sao (X'X) e (X'y) (o produto cruzado entre as 
variaveis X e y) e a incognita e (3. Agora, utilizando a algebra matricial, se a inversa de (X'X) existe, por 
exemplo, (X'X) -1 , ao multiplicarmos ambos os lados da Equagao (C.3.10) por essa inversa, obtemos: 

(X'X)“ ! (X'X)P = (X'X) - 'X'y 


Entretanto, (X'X) '(X'X) = I, uma matriz identidade de ordem k x k, temos: 

IP= (X'X)"'X'y 


OU 


P = (X'X)-' X' y 
kx 1 kx k (k x n) (n X 1) 


(C.3.11) 


5 Essas equagoes podem ser lembradas facilmente. Comece com a equagao V) = A + p 2 X 2i + Aft; + — + Aft- 
Ao somarmos essa equagao sobre os n valores, obtemos a primeira equagao de (C.3.8); ao multiplicarmos os dois 
lados por X 2 e ao somarmos sobre n, obtemos a segunda equagao; ao multiplicarmos por X 3 os dois lados e ao 
somarmos sobre n, obtemos a terceira equagao e assim por diante. Observe que a primeira equagao de (C.3.8) 
oferece imediatamente = Y - ft 2 ft --A:ft (cf. (7.4.6)). 
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A Equagao (C.3.11) e um resultado fundamental da teoria dos MQO na notagao matricial. 

Ela mostra como o vetor (3 pode ser estimado com base nos dados fornecidos. Embora a Equagao 
(C.3.11) tenha sido obtida por meio da Equagao (C.3.9), ela pode ser obtida diretamente pela Equa¬ 
gao (C.3.7) por meio da diferenciagao do u'li com relagao a (3. A demonstragao e dada no Apendice 
CA, Segao CA.2. 


Uma ilustra^ao 

Para ilustrarmos os metodos matriciais desenvolvidos ate aqui, vamos trabalhar com um exemplo 
que relaciona as variaveis consumo e renda, utilizando-nos dos dados da Equagao (C. 1.6). Para o caso 
de duas variaveis, temos: 


P = 


(X'X) = 


h 

Pi 


l l l 

X, X 2 A 3 


1 

X n 


1 X\ 

1 x 2 
1 a 3 


1 X; 


N. 


X'y = 


1 1 


1 


Xi X 2 X, 


1 

x n 


Utilizando os dados da Equagao (C.1.6), obtemos 

X'X = 


Yi 

Y 2 

Y 2 


10 1700 

1700 322000 


n E Xt 

E x i E xf 


E^ 
E XiYi 


e 


X'y = 


1110 

205500 


Ao empregarmos as regras da inversao de matrizes apresentada no Apendice B, Segao B.3, po- 
demos ver que a inversa da matriz anterior (X'X) e 


X'X” 1 = 


0,97576 

-0,005152 


-0,005152 

0,0000303 


Portanto, 



0,97576 

-0,005152 

1110 ' 


-0,005152 

0,0000303 

205500 


24,4545 

0,5079 


Utilizando um computador, obtivemos /i, = 24,4545 c f> 2 = 0,5091. A diferenga entre as duas 
estimativas deve-se a erros de arrcdondamento. Observe que, ao trabalharmos com uma calculadora, 
e fundamental, ao obtermos resultados com diversos digitos significativos, minimizar os erros de ar- 
redondamento. 
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A 

Matriz de variancias e covariancias de P 

Os metodos matriciais nos permitem desenvolver formulas nao apenas para a variancia de 
qualquer elemento dado de p, mas tambem para a covariancia entre qualquer um dos dois elementos 
de p, por exemplo, P, e ft r Precisamos dessas variancias e covariancias para o proposito de realizar- 
mos inferencias estatfsticas. 

Por definipao, a matriz de variancia-covariancia de p e (compare a Equapao (C.2.2)) 
var-cov(P) = E{[ p- £(p)][p- £(p)]'} 

que pode ser escrita explicitamente como: 


-cov (P) = 


var(ySi) cow(Pi,p 2 ) 
cov(/S 2 , A) var(/S 2 ) 

.cov (/3 k , fr) cov(p k ,p 2 ) 


cov (P\, 
cov(/i 2 , p k ) 

var (fa) . 


(C.3.12) 


No Apendice CA, Sepao CA.3, mostraremos que a matriz de variancia-covariancia anterior pode 
ser obtida por meio da seguinte formula: 

var-cov(P) = ct 2 (X'X) 1 (C.3.13) 


em que a 2 corresponde a variancia homocedastica de m, e (X'X) 1 e a inversa da matriz que aparece 
na Equapao (C.3.11), a qual da p, que corresponde ao estimador de MQO. 

Nos modelos de regressao linear de duas e tres variaveis, um estimador nao viesado de a 2 foi dado 
por cr 2 = X! Ui/( n ~2) e a~ = ^uj/{n - 3), respectivamente. No caso de k variaveis, a formu¬ 
la correspondente e: 


n - k 


uu 

n - k 


(C.3.14) 


em que ha agora n — k graus de liberdade. (Por que?) 

Embora, em princfpio, u'u possa ser calculado com base nos resfduos estimados, na pratica ele 
podeserobtidodiretamentecomomostramosaseguir.Lembrandoquew 2 ( = SRQ)= STQ- SQE, 
, no caso de duas variaveis, podemos escrever: 


E 


U 2 




(3.3.6) 


e no caso de tres variaveis 


E«- = E a _ ft E^^ 2 ' _ ft E* x * 


(7.4.19) 


Estendendo esse princfpio, e possfvel ver que, para o modelo de k variaveis, 

E= E- v ' 2 - ft E- v ' X2 '- — ft E* x * (c.3.15) 


Em notapao matricial. 
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STQ: y'y- nf 2 

SQE: ft y,X2 ‘ + ' ’' + yiXki = P'X'y - nY 2 
em que o termo n Y 2 e conhecido como a corre£ao para a media. 6 Portanto, 


(C.3.16) 

(C.3.17) 


u'u = y'y-p'X'y (C.3.18) 

Uma vez que tenhamos obtido u'u, a 2 pode ser facilmente calculado pela Equa£ao (C.3.14), a 
qual, por sua vez, permite estimar a matriz de variancia-covariancia (C.3.13). 

Para nosso exemplo ilustrativo. 


u'u = 132100- [24,4545 
= 337,373 


0,5091] 


1110 

205500 


Portanto, a a 1 — (337,273/8) = 42,1591, que e aproximadamente o valor obtido no Capltulo 3. 

A 

Propriedades do vetor de MQO p 

Nos casos de duas ou tres variaveis, sabemos que os estimadores de MQO sao lineares e nao 
viesados, e na classe de todos os estimadores lineares nao viesados, eles tem variancia minima (a 
propriedade de Gauss-Markov). Em resumo, os estimadores de MQO sao os melhores estimadores 
lineares nao viesados (BLUE, ou seja, melhores estimadores lineares nao viesados). Essa propriedade 
estende-se ao vetor p; ou seja, Pe linear (cada um dos seus elementos e uma funcao linear de Y, a 
variavel dependente). £(p) = p, ou seja, o valor esperado de cada elemento de Pe igual ao elemento 
correspondente do verdadeiro p, e, na classe de todos os estimadores nao viesados de p, o estimador 
de MQO Ppossui uma variancia minima. Aprova disso e apresentada no Apendice CA, Sec^ao CA.4. 
Conforme dissemos na Introdu£ao, o caso de k variaveis e, na maioria dos casos, uma extensao dire- 
ta dos casos de duas e tres variaveis. 


C.4 O coeficiente de determina^ao R 2 em nota^ao matricial 

O coeficiente de determinac^ao de R 2 foi definido como 

r2 = SQE 


No caso de duas variaveis. 


e no caso de tres variaveis 


R 2 = 


STQ 

Ey? 


(3.5.6) 


„2 _ p2 T,y> x 2i + A X>i*3i 

E.v , 2 

Generalizando, obtemos, no caso de k variaveis 
R 2 = 


2 _ ftE Vi X2i + Pi Y.yi x 3; + • ■ • + Pk E Yi x ki 


E» 


(7.5.5) 


(C.4.1) 


6 E yf = E(Yi - Y) 2 = £ Yf - nY 2 = y'y - nY 2 . Sendo assim, sem o termo de corregao, y'y dara apenas a soma 
bruta dos quadrados, e nao a soma dos quadrados dos desvios. 
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Utilizando as Equapoes (C.3.16) e (C.3.17), a Equapao (C.4.1) pode ser escrita como: 


R 2 


P'X'y — nY 2 
y'y - nY 2 


a qual da a representapao matricial de R 1 . 
Para o nosso exemplo ilustrativo. 


P'X'y = 
y'y = 


[24,3571 0,5079] 

131.409,831 

132.100 


1.110 

205.500 


(C.4.2) 


e 


nY 2 = 123.210 

Ao inserirmos esses valores na Equapao (C.4.2), vemos que R 2 — 0,9224, que e quase o mesmo 
que obtivemos antes, exceto em relapao aos erros de arredondamento. 


C.5 A matriz de correlates 

Nos capitulos anteriores, encontramos coeficientes de correlapao de ordem zero, ou simples, r 12 , 
/-| 3 , r 2 3 , e coeficientes de correlapao parcial, ou de primeira ordem, r l22 , r 132 , r 231 , e suas interrela- 
poes. No caso de k variaveis, temos ao todo k(k — l)/2 coeficientes de correlapao de ordem zero. (Por 
que?) Essas k(k — l)/2 correlapoes podem ser colocadas em uma matriz, designada matriz de cor¬ 
relates, como se segue: 


R = 

" r ii 

f21 

^"12 

f 22 

n 3 ••• 
r2i ... 

r\k 

rik 


. 

m 

riel ■ ■ ■ 

rkk 


' 1 

r \2 

r\3 ■■■ 

r\k 

= 

^21 

1 

f 2i ... 

rik 


. r k i 

r\a 

rk-i ■■■ 

1 


em que o subscrito 1, como anteriormente, denota a variavel dependente Y (r 12 significa coeficiente de 
correlapao entre Ye X 2 e assim por diante) e utiliza-se do fato de que o coeficiente de correlapao de uma 
variavel que diz respeito a ela mesma e sempre 1 (r,, = r 22 - ■ ■ ■ = r kk = 1 ). 

Com base na matriz de correlaijao /?, pode-se obter coeficientes de correlapao de primeira ordem 
(veja o Capftulo 7) e de ordem maior como r 12 34 k . (Veja o Exercfcio C.4.) Muitos programas de 
computador usualmente calculam a matriz R. Utilizamos a matriz de correlates no Capftulo 10. 


C.6 Teste de hipoteses sobre coeficientes de regressao individual em 
nota^ao matricial 

Por motivos apresentados nos capitulos anteriores, se o nosso objetivo e a inferencia, bem como 
a estimapao, devemos pressupor que os termos de erro u, seguem alguma distribuipao de probabili- 
dade. Alem disso, por razoes oferecidas anteriormente, na analise de regressao, pressupomos que, 
em geral, cada u ,■ segue uma distribuipao normal com media zero e variancia cr 2 constante. Em nota- 
pao matricial, temos: 
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u~V(0,cr 2 I) (C.6.1) 

em que u e 0 sao vetores coluna n x 1 e I e uma matriz identidade n x n, sendo 0 o vetor nulo. 

Dada a hipotese de normalidade, sabemos que, em modelos de regressao linear de duas e tres 
variaveis, (1) os estimadores de MQO /),■ e os estimadores de maxima verossimilhan^a fi, sao identi- 
cos, mas o estimador de maxima verossimilhanga a 2 e viesado, embora esse vies possa ser removido 
utilizando o estimador nao viesado de MQO a 2 ; e (2) os estimadores de MQO /l, sao tambem nor- 
malmente distribufdos. Generalizando, no caso de k variaveis, podemos mostrar que 


P~ iV^CT^X'X)- 1 ] (C.6.2) 

ou seja, cada elemento p esta normalmente distribui'do com media igual ao elemento correspondente 
do verdadeiro Pea variancia e dada por cr multiplicado pelo elemento diagonal apropriado da matriz 
inversa (X'X)->. 

Visto que, na pratica, a 2 e desconhecido, ele e estimado por a 2 . Portanto, pela troca usual para 
a distribu^ao t, segue-se que cada elemento p acompanha a distribu^ao t com n — k gl. Sim- 
bolicamente. 


A - Pi 

ep(A) 


(C.6.3) 


com n — k gl, em que A e qualquer elemento de p. 

A distribui£ao t pode, por conseguinte, ser utilizada para testar hipoteses sobre o verdadeiro 
bem como para estabelecer intervalos de confian^a sobre isso. A real mecanica ja foi ilutrada nos 
Capftulos 5 e 8. Para um exemplo mais completo, veja a Se 5 ao C.10. 


C.7 Teste da significancia geral da regressao: analise de variancia em 
nota^ao matricial 

No capitulo 8, desenvolvemos a tecnica ANOVA(l) para testar a significancia global da regressao 
estimada, ou seja, para testar a hipotese nula de que os verdadeiros coeficientes angulares (parciais) 
sao simultaneamente iguais a zero e (2) para estimar a contribu^ao incremental de uma variavel ex¬ 
planatory. A tecnica ANOVA pode ser facilmente estendida ao caso de k variaveis. Lembre-se de que 
a tecnica ANOVA consiste em decompor a soma total dos quadrados (STQ) em dois componentes: 
a SQE e a SQR. As expressoes matriciais para essas tres somas de quadrados ja foram forneci- 
das nas Equagoes (C.3.16), (C.3.17) e (C.3.18). Os graus de liberdade associados a essas somas 
de quadrados sao n — 1, k — 1 e n — k, respectivamente. (Por que?) Segundo a Tabela 8.1 do Ca- 
pftulo 8, podemos elaborar a Tabela C.2. 


TABELA C.2 

Causas da varia^ao 

Soma de 

gl. 

Soma de 

Formulagao matricial 


quadrados 


quadrados medios 

da tabela ANOVA 

Decorrente da regressao 

P'X'y - nY 2 

k - 1 

pX'y - n? 2 

para o modelo de 

(ou seja, decorrente de 




regressao lineal' com k 

x 2 , x 3 ,...,xq 



k - 1 

variaveis 




y'y- P'X'y 


Decorrente de residuos 

yy - P'X'y 

n- k 

n - k 


Total 

yy - nY 

n- 1 
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Admitindo que os termos de erro m, estejam normalmente distribmdos e que a hipotese nula seja 
Pi = Pi = • ■ ■ = Pk = 0, de acordo com o Capftulo 8, podemos mostrar que 


p = (P'X'y - n? 2 )/(k- 1) 7 

(y'y- p'X'y)/(ij - k) 

segue a distribuigao F com k — 1 e n — k graus de liberdade. 

No Capftulo 8, vimos que, sob as hipoteses declaradas anteriormente, ha uma estreita relagao 
entre F e R 2 , ou seja. 


R 2 /(k- 1) 

(1 - R 2 )/(n - k ) 


(8.4.11) 


Sendo assim, a Tabela C.2 de ANOVA pode ser expressa como a Tabela C.3. Uma vantagem da 
Tabela C.3 sobre a C.2 e que toda a analise pode ser feita em termos de R 2 \ nao e necessario conside- 
rar o termo (y'y — nY 2 ), pois ele e exclufdo no quociente F. 


TABELA C.3 

Tabela ANOVA com k 
variaveis em forma 
matricial em termos 
detf 2 


Causas da variagao 

Soma de quadrados 

gl. 

Decorrente da regressao 



(ou seja, decorrente da 
X 2 , x 3( ..., X k ) 

R 2 (y'y - nY 2 ) 

k- 1 

Decorrente de resfduos 

(1 - R 2 )(y'y-nY 2 ) 

n - k 

Total 

f (7 2 

y'y - nY 

n- 1 


Soma de 

quadrados medios 


2 , 


(1 


R\y' y- nY ) 
k- 1 
R 2 )(y'y 


nY 2 ) 


n- k 


C.8 Teste de restri^oes lineares: teste F geral por meio da 
nota^ao matricial 

Na Se 5 ao 8.6 apresentamos o teste F geral para testar a validade das restr^oes lineares impostas 
a um ou mais parametros do modelo de regressao linear com k variaveis. O teste apropriado foi for- 
necido em (8.6.9) (ou seu equivalente, a Equagao (8.6.10)). A contrapartida da matriz de (8.6.9) pode 
ser facilmente calculada. 

Sejam 

u R = vetor dos resfduos da regressao por mfnimos quadrados restrita 
u UR = vetor dos resfduos da regressao por mfnimos quadrados irrestrita 

Entao, 

u' r Ur = «r = soma dos quadrados dos resfduos para a regressao restrita 
u' uur = V m? tr = soma dos quadrados dos resfduos para a regressao irrestrita 
m = numero de restri goes lineares 

k — numero de parametros (incluindo o intercepto) na regressao sem restrigoes 
n = numero de observagoes 

A contrapartida da matriz da Equagao (8.6.9) e, por conseguinte, 

P _ (“r% ~ Murmur)/” 2 (C.8.1) 

(%r«ur)/(m — k) 

que segue a distribuigao F com (m, n — k) graus de liberdade. Como de costume, se o valor F calcu- 
lado da Equagao (C.8.1) exceder o valor crftico de F, podemos rejeitar a regressao restrita; caso con- 
trario, nao a rejeitamos. 
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C.9 Previsao com o uso da regressao miiltipla: iormiilacao matricial 

Na Segao 8.8 discutimos, utilizando a notagao escalar, de que modo a regressao multipla estimada 
pode ser empregada para prever (1) a media e (2) os valores individuals de Y, dados os valores dos 
regressores X. Nesta segao, mostramos como expressar essas previsoes na forma de matriz. Apresen- 
tamos tambem as formulas para estimar as variancias e os erros padrao dos valores previstos; no 
Capitulo 8, observamos que essas formulas sao mais bem utilizadas na notagao matricial e que, para 
expressoes escalares ou algebricas dessas formulas, tomam-se mais complicadas. 

Previsao da media 

Seja 


X„ = 


1 

Xq3 


(C.9.1) 


lx 0k ] 

o vetor de valores das variaveis X para as quais desejamos prever Y fh a previsao da media de Y. 
Agora a regressao multipla estimada, na forma escalar, e 


Yi- P\+ PiXii + $3X7, i + ■ ■ ■ + P k Xki + Ui 


(C.9.2) 


que, em notagao matricial, pode ser escrita de modo compacto como 

Yi = xjp (C.9.3) 

em que x| = [1 X 2i X 3i ■■■ X ki ]e 

"A" 



A Equagao (C.9.2) ou (C.9.3) e, certamente, a previsao da media de Y t que corresponde a um dado x'. 
Se x'j e tal como na Equagao (C.9.1), a Equagao (C.9.3) torna-se 

(Yi | Xo) = xoji (C.9.4) 

em que, e claro, os valores de x 0 estao especificados. Observe que a Equagao (C.9.4) e da uma previsao 
nao viesada de E(Y ,-1 Xq), desde que = xo|3. (Por que?) 

Variancia da previsao da media 

A formula para estimar a variancia de (K n I Xq) e a seguinte: 7 

var(F 0 | xo) = ct^^X^^'xo (C.9.5) 

em que er 2 e a variancia de Xq sao os valores dados das variaveis X para as quais desejamos realizar 
a previsao e (X'X) corresponde a matriz dada na Equagao (C.3.9). Na pratica, substitufmos a 2 por seu 
estimador nao viesado a 2 . 

7 Sobre a derivagao, veja JOHNSTON, J. Econometrics methods. 3. ed. Nova York: McGraw-Hill, 1984. p. 195-196. 
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Ilustraremos a previsao da media e sua variancia na proxima se 9 ao. 

Previsao individual 

Conforme indicamos nos Capftulos 5 e 8, a previsao individual de Y ( = Y 0 ) e igualmente dada 
pela Equa 5 ao (C.9.3) ou mais especificamente pela Equa^ao (C.9.4). A diferenpa entre as previsoes 
da media e a individual encontra-se em suas variancias. 

Variancia da previsao individual 

A formula para a variancia de uma previsao individual e como segue: 8 

var( Yq | x 0 ) = cr 2 [l + x^X'X)" *x 0 ] (C.9.6) 

em que var (Y 0 I x o) representa E[Y 0 — Y {] I X] 2 . Na pratica, substitufmos er 2 por seu estimador nao 
viesado a 2 . Ilustraremos essa formula na proxima se§ao. 


C.10 Resumo da abordagem matricial: um exemplo ilustrativo 

Considere os dados apresentados na Tabela C.4. Esses correspondent a despesas pessoais de con- 
sumo (DCPC), de renda pessoal disponfvel per capita (RPDPC) e tempo ou uma variavel de tenden- 
cia. Incluindo uma variavel de tendencia no modelo, estamos tentando descobrir a rela§ao entre 
DCPC e a RPDPC descartada da variavel de tendencia (a qual pode representar uma gama de outros 
fatores, como a tecnologia, as mudan 5 as nos gostos etc.)- 
Com propositos empfricos, o modelo de regressao e, entao 

Yi = ft i + PiXn + PiX-a + Uj (C.10.1) 

em que Y — despesas de consumo per capita, X 2 = renda disponfvel per capita, X 2 = tempo. Os dados 
necessarios para realizarmos a regressao (C. 10.1) estao na Tabela C.4. 

Em notapao matricial, nosso problema pode ser mostrado como a seguir: 


1673 


1 

1839 

1 


U\ 

1688 


1 

1844 

2 


«2 

1666 


1 

1831 

3 


A 

1735 


1 

1881 

4 


«4 

1749 
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1883 

5 


A 

1756 


1 

1910 

6 




A 

1815 


1 

1969 

7 


A 


ii 2 

1867 


1 

2016 

8 


A 

+ 

A 

1948 


1 

2126 

9 


A. 


A 

2048 


1 

2239 

10 




Ao 

2128 


1 

2336 

11 


A i 

2165 


1 

2404 

12 


«12 

2257 


1 

2487 

13 


A 3 

2316 


1 

2535 

14 


A 4 

2324. 


. 1 

2595 

15. 


. »15 . 

y 

= 


X 


P 

+ 

U 

15 x 1 


15x3 


3 x 1 

15 x 1 


(C.10.2) 


Ibid. 
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TABELA C.4 

Despesas pessoais de 
consumo per capita 
(DCPC) e renda 
pessoal dispomvel per 
capita (RPDPC) nos 
Estados Unidos, 
1956-1970, em 
dolares de 1958 

Fonte: Economic Report of 
the President, janeiro de 
1972, Tabela B-16. 


dcpc,k 

RPDPC, X 2 

Tempo X 3 

dcpc,k 

RPDPC, X 2 

Tempo, X 3 

1673 

1839 

1 (= 1956) 

1948 

2126 

9 

1688 

1844 

2 

2048 

2239 

10 

1666 

1831 

3 

2128 

2336 

11 

1735 

1881 

4 

2165 

2404 

12 

1749 

1883 

5 

2257 

2487 

13 

1756 

1910 

6 

2316 

2535 

14 

1815 

1969 

7 

2324 

2595 

15 (= 1970) 

1867 

2016 

8 





Com base nos dados anteriores, obtemos as seguintes quantidades: 


Y = 1942,333 X 2 = 2126,333 X 3 = 8,0 


- Y) 2 = 830.121,333 

£(X 2i - X 2 ) 2 = 1.103.111,333 ~ X ^ 2 = 280 ’° 



1 

1 1 

1 

XX = 

X 2 \ 

X22 X23 ■ 

X 2n 


_X 3 1 

X32 X33 • 

•• x 3n _ 


n 

£* 2 < 

£^ 3 i 

= 


£ 4 - 

£* 2 /* 


.£*3, 

£M 3i . 

£4, 


X21 

X 3 1 

X22 

^3 2 

x 2 i 

X 3 3 

X 2 „ 

X 3n 


15 31.895 120 

31.895 68.922,513 272.144 

120 272.144 1240 


X'y = 


29.135 

62.905.821 

247.934 


(C.10.3) 


(C.10.4) 


Utilizando as regras de inversao de matrizes apresentada no Apendice B, e possrvel ver que 



37,232491 

-0,0225082 

1,336707 ' 

(X'X)- 1 = 

-0,0225082 

0,0000137 

-0,0008319 

Sendo assim. 

1,336707 

-0,0008319 

0,054034 . 


p= (X'X)- 1 X'y = 


300,28625 

0,74198 

8,04356. 


(C.10.5) 


(C.10.6) 


A soma dos quadrados dos reslduos pode ser agora calculada como 


E 


U 2 


iiu 

y'y- P'x'y 


29.135 

62.905.821 

247.934 


= 57.420.003 - [300,28625 0,74198 8,04356] 
= 1976,85574 


(C.10.7) 
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de onde obtemos 


a 


2 


u'u 

"12 


164,73797 


A matriz de variancia e covariancia para (3 pode, entao, ser mostrada como 


var-cov(P) = or 2 (X'X)-' 


6133,650 

-3,70794 

220,20634 


-3,70794 

0,00226 

-0,13705 


220,20634 

-0,13705 

8,90155 


(C.10.8) 


(C.10.9) 


Os elementos na diagonal dessa matriz fornecem as variancias de /be /rf, respectivamente, e 
suas raizes quadradas fomecem os erros padrao correspondentes. 

Com base nos dados anteriores, podemos verificar que 

SQE: p'X'y - nY 2 = 828.144,47786 (C.10.10) 


STQ: y'y- nY 2 = 830.121,333 

Portanto, 

r2= p'X'y - nY 2 

y'y - nY 2 

828.144,47786 
~ 830.121,333 

= 0,99761 


(C.10.11) 


(C.10.12) 


Aplicando a Equagao (7.8.4) pode-se ver que o coeficiente de determina^ao ajustado e 


R 2 = 0,99722 


(C.10.13) 


Reuni ndo nossos resultados ate aqui, temos 


) = 300,28625 

+ 0,74198A 2/ + 8,04356X 3 , 

(78,31763) 

(0,04753) 

(2,98354) 

t= (3,83421) 

(15,60956) 

(2,69598) 


R 2 = 0,99761 R 2 = 0,99722 gl = 12 


(C.10.14) 


A interpretacjao da Equapao (C. 10.14) e esta: se tanto X 2 e X 2 estao fixados com valor zero, o valor 
medio das despesas de consumo pessoal per capita esta estimado em torno de $ 300. Como de costu¬ 
me, essa interpretacjao mecanica do intercepto deve ser vista com precau^ao. O coeficiente de regres¬ 
sao parcial de 0,74198 significa que, se forem mantidas constantes todas as outras variaveis, um 
aumento de renda per capita de, por exemplo, um dolar sera acompanhado por um aumento na media 
dos gastos com consumo pessoal per capita de aproximadamente 74 centavos. Em resumo, estima-se 
que a propensao marginal de consumo seja de aproximadamente 0,74 ou 74%. De modo semelhante, 
ao mantermos constantes todas as outras variaveis, a media do gasto com consumo pessoal per capi¬ 
ta aumentou na taxa de aproximadamente $ 8 por ano durante o perfodo do estudo, ou seja, entre 1956 
e 1970. O valor R 2 de 0,9976 mostra que as duas variaveis explanatorias sao responsaveis por mais 
de 99% da variagao dos gastos de consumo per capita nos Estados Unidos durante o perfodo entre 
1956 e 1970. Embora R 2 diminua levemente, ele continua ainda bastante alto. 
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TABELA C.5 

A Tabela ANOVA 
para os dados da 
Tabela C.4 


Causas da varia^ao 

Soma de quadrados 

gl. 

Soma de 

quadrados medios 

Decorrente de X 2 , X 2 

828.144,47786 

2 

414.072,3893 

Decorrente de residuos 

1.976,85574 

12 

164,73797 

Total 

830.121,33360 

14 



Em relac^ao a significancia estatistica dos coeficientes estimados, observamos, a partir da Equa?ao 
(C.10.14), que cada um deles e significante em termos estatisticos e individuals, por exemplo, no 
nivel 5: as razoes entre os coeficientes estimados e seus erros padrao (ou seja, razoes t) sao 3,83421, 
15,61077 e 2,69598, respectivamente. Utilizando um teste t bicaudal no nivel de significancia de 5%, 
vemos que o valor t crftico para 12 graus de liberdade e 2,179. Cada um dos valores t calculados ex- 
cede esse valor crftico. Sendo assim, individualmente, podemos rejeitar a hipotese nula de que o 
verdadeiro valor populacional do coeficiente relevante e zero. 

Conforme observamos anteriormente, nao podemos aplicar o teste 1 usual para testar simultanea- 
mente a hipotese de que fi 2 — = 0 porque o procedimento do teste t pressupoe que extrafmos uma 

amostra cada vez que o teste e aplicado. Se a mesma amostra e utilizada para testar simultaneamente 
hipoteses sobre fi 2 e (i 2 , provavelmente os estimadores fi 2 e A estao correlacionados, violando, assim, 
a hipotese subjacente ao procedimento do teste t? De fato, ao observamos a matriz de variancia e 
covariancia de (3 da Equagao (C.10.9) vemos que os estimadores /1 2 e apresentam uma correla£ao 
negativa (a covariancia entre os dois e —0,13705). Sendo assim, nao podemos utilizar o teste t para 
testar a hipotese nula de que /3 2 = fii = 0. 

Lembre-se, porem, de que uma hipotese nula como fi 2 — fi 2 = 0, simultaneamente, pode ser tes- 
tada por meio da tecnica de analise de variancia e o teste F concomitante, apresentados no Capftulo 8. 
Para o nosso problema, a analise de variancias corresponde aquela da Tabela C.5. Sob as hipoteses 
usuais, obtemos 


414.072,3893 

164,73797 


2513,52 


(C.10.15) 


que e distribufda conforme a distribuiijao F com 2 e 12 graus de liberdade. O valor calculado de F e 
obviamente altamente significativo; podemos rejeitar a hipotese nula de que p 2 = fi} = 0, ou seja, de 
que os gastos com consumo pessoal per capita nao estejam linearmente relacionados com a renda 
disponfvel per capita e a tendencia. 

Na Se 5 ao C.9, discutimos os mecanismos da previsao, tanto da previsao media quanto da individual. 
Imagine que, em 1971, o numero da renda pessoal disponfvel (RPD) tenha sido de $ 2.610 e que dese- 
jemos prever o consumo pessoal per capita (DCPC) correspondente a esse numero. Entao, a previsao 
media, bem como a individual, do DCPC de 1971 e a mesma e e dada como 


(DCPC 1971 |RPD 19 7 i ,*3 


16) - x 197i p 


[1 2610 16] 


300,28625 

0,74198 

8,04356 


2365,55 


(C.10.16) 


em que fazemos uso da Equa§ao (C.9.3). 


9 Veja a Segao 8.4 para mais detalhes. 
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As variancias de y 1971 e y 1971 , como sabemos, pela Sesao C.9, sao diferentes e sao as seguintes: 


var(71971 | x 1971) = 0- [Xi97i( x ' x ) X1971] 


; V \-1 


= 164,73797[1 2610 16](X'X) 


1 

2610 

16 


(C.10.17) 


em que (X'X) 1 esta apresentado na Equagao (C.10.5). Substituindo essa equagao na Equagao 
(C.10.17), o leitor verificaraque 


var(7i97i | x' 1971 ) = 48,6426 


(C.10.18) 


e, portanto. 


ep(7i97i |x , I971 ) = 6,9744 


Deixamos ao leitor a tarefa de verificar, por meio da Equagao (C.9.6), que 

var(7i97i |x' 1971 ) = 213,3806 


(C.10.19) 


e 


se(7i97i | x / i97i) — 14,6076 


Nota: var(7i97i | x' 197I ) = E[7 i 97 i - 7i 97 i | x' 1971 ] 2 . 

Na Segao C.5, apresentamos a matriz de correlagoes R. De acordo com nossos dados, a matriz de 
correlagao e a seguinte: 



Y 

*2 

X 3 

7 

' 1 

0,9980 

0,9743 

R = X 2 

0,9980 

1 

0,9664 


_ 0,9743 

0,9664 

1 


(C. 10.20) 


Observe que, na Equagao (C. 10.20), delimitamos a matriz de correlagoes com as variaveis do modelo, 
para que possamos identificar prontamente quais variaveis estao envolvidas no calculo do coeficiente 
de correlagao. Sendo assim, o coeficiente 0,9980, na primeira linha da matriz (C. 10.20) informa que 
esse e o coeficiente de correlagao entre Y e X 2 (ou seja, r 12 ). Das correlagoes de ordem zero apresen- 
tadas na matriz de correlagoes (C. 10.20) pode-se facilmente derivar os coeficientes de correlagao de 
primeira ordem. (Veja o Exercfcio C.7.) 


C.ll Mmimos quadrados generalizados (MQG) 

Em diversas ocasioes, mencionamos que os MQO sao um caso especial de MQG. Para observar esse 
dado, retome a Equagao (C.2.2). Para considerar as variancias heterocedasticas (os elementos na diagonal 
principal da Equagao (C.2.2)) e as autocorrelagoes nos termos de erro (os elementos que estao fora da 
diagonal principal da Equagao (C.2.2)), suponha que 

E(uu') = er 2 V (C.11.1) 

em que V e uma matriz conhecida de nxn. 

Sendo assim, se nosso modelo e: 


y = Xp + u 
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em que £(u) = Oe var-cov (u) = a 2 V. No caso de a 2 ser desconhecido, o que normalmente ocorre, 
V, entao, representa a pressuposta estmtura de variancias e covariancias entre os os termos de erro 
aleatorios u,. 

Sob as condi 9 oes determinadas dos termos de erro da variancia-covariancia, e possivel de- 
monstrar que 

p mqg = (X'V- 1 X)“ 'X'V- >y (C .11 .2) 

P mqs e conhecido como o estimador de mmimos quadrados generalizados (MQG) de p. 

Pode-se tambem mostrar que 

var-cov (p mqg ) = ^(X'V ! X)- 1 (C.11.3) 

E possivel mostrar que P 11 " 1 ' e o melhor estimador nao viesado linear de p. 

Se considerarmos que a variancia de cada termo de erro e a propria constante a 2 e os termos de 
erro nao estao mutuamente correlacionados, entao a matriz V reduz-se a matriz identidade, conforme 
apresentado na Equagao (C.2.3). Se os termos de erro nao estao mutuamente correlacionados, mas 
possuem variancias diferentes (heterocedasticas), a matriz V sera diagonal com variancias desiguais 
com a diagonal principal. E claro que, se houver heterocedasticidade bem como autocorrelafao, a 
matriz V tera entradas na diagonal principal e fora da diagonal. 

O verdadeiro problema, na pratica, e que nao conhecemos a 2 e nem as verdadeiras variancias e 
covariancias (a estrutura da matriz V). Como solu 9 ao, podemos utilizar o metodo dos mmimos 
quadrados generalizados estimados (ou faetiveis) (MQGE). Nesse caso, estimamos primeiro 
nosso modelo por MQO, desconsiderando os problemas de heterocedasticidade e/ou correlaijao. 
Obtemos os residuos com base nesse modelo e formamos a matriz de variancia-covariancia (estima- 
da) do termo de erro substituindo as entradas na expressao anterior a Equa 9 ao (C.2.2) pelo u estimado, 
ou seja, u (e possivel mostrar que os estimadores de MQGE sao estimadores consistentes de MQG). 
Simbolicamente, 


p mqge = (X 'V“ 1 X)“ 1 (X'V - 1 y) (C.11.4) 

var-cov (p mqge ) = a 2 (X'V ! X) 1 (c.11.5) 


em que V e uma estimativa de V. 


C.12 Resumo e conclusoes 

O principal proposito deste apendice foi introduzir a abordagem matricial ao modelo classico de 
regressao linear. Embora muito poucos conceitos novos de analise de regressao tenham sido introdu- 
zidos, a nota 5 ao matricial oferece um metodo compacto de lidarmos com os modelos de regressao 
linear que envolvam qualquer numero de variaveis. 

Para concluir o apendice, observe que, se as variaveis YeX sao medidas na forma de desvios, ou 
seja, como desvios de suas medias amostrais, ha poucas mudan 5 as nas formulas apresentadas ante- 
riormente. Essas mudan 9 as estao indicadas na Tabela C.6. 10 Conforme mostra essa tabela, na forma 
de desvio, a corre 9 ao para a media de n Y 1 exclui-se da soma total dos quadrados (STQ) e da soma dos 
quadrados explicados (SQE). (Por que?) Essa perda resulta em uma mudan 9 a na formula para R 2 . Por 
outro lado, a maioria das formulas desenvolvidas nas unidades originais de mensura 9 ao permanece 
valida para a forma de desvios. 


10 Hoje em dia, com computadores de alta velocidade, talvez a forma de desvio nao seja necessaria; mas ela simpli- 
fica formulas e, portanto, os calculos, se estivermos trabalhando com uma calculadora e com numeros elevados. 
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TABELA C.6 

Modelo de regressao 
com k variaveis em 
unidades originais e 
na forma de desvio* 

Unidades originais 

y= Xp+ u 

P= (X'X) 1 X'y 

(C.3.2) 

(C.3.11) 

Forma de desvios 

y = Xp + u 

A coluna dos 1, na matriz X, 
desaparece. (Por que?) 

Igual 



var-cov(p)= a 2 (X'X) _1 

(C.3.13) 

Igual 



u'u = y'y - p'X'y 

(C.3.18) 

Igual 



Lx , 2 = y'y - n? 2 

(C.3.16) 

E yf = y'y 

(C.12.1) 


SQE = P'X'y - n? 2 

(C.3.17) 

SQE = p'X'y 

(C.l 2.2) 


P'X'y - n? 2 

K y'y - n? 2 

(C.4.2) 

, P'X'y 

r 2 = 

y y 

(C.l 2.3) 


*Observe que, embora os sfmbolos das matrizes e dos vetores sejam os mesmos, em ambos os casos, na forma de desvios que os 
elementos das matrizes e dos vetores sao considerados, estes constituem desvios em vez de dados brutos. Observe tambem que P 
na forma de desvio e da ordem k — 1 e que var-cov (p) e da ordem (k — l)(fc — 1). 


EXERCICIOS 


C.l. Para o exemplo ilustrativo discutido na Segao C.10, X'X e X'y, utilizando os dados na forma 
de desvio, sao como segue: 


XX = 


1.103.111,333 

16.984 


16.984 

280 


X'y = 


955.099,333 

14.854,000 


a. Estime P 2 e P 2 . 

b. Como voce estimaria /l,? 

c. Obtenha a variancia de P 2 e ft e suas covariancias. 

d. Calcule R 2 c R 2 . 

e. Comparando seus resultados com os da Segao C. 10, quais, na sua opiniao, sao as vantagens da 
forma de desvios? 

C.2. Retome o Exercicio 22.23. Utilizando os dados nele apresentados, prepare a matriz apropriada 
(X'X) e o vetor X'y e estime o vetor de parametro (3, bem como sua matriz de variancia e co- 
variancia. Obtenha tambem R 2 . De que modo voce testaria a hipotese de que as elasticidades 
de Ml em relagao ao PIB e a taxa de interesse R sao numericamente iguais? 

C.3. Testando a igualdade de dois coeficientes de regressao. Suponha que lhe seja apresentado o 
seguinte modelo de regressao: 


Yi — ft i + p 2 X 2i + PiXt, i + Uj 


e que voce queira testar a hipotese de que p 2 — /? 3 . Se considerarmos que m, esta normalmente 
distribufdo, e posslvel mostrar que 

t _ _ Pi ~ Pz _ 

^var (p 2 ) + var(ft) - 2co v(p 2 , p 3 ) 

segue a distribuigao t com n — 3 graus de liberdade (veja a Segao 8.5). (Em geral, para os 
casos de k variaveis, os graus de liberdade sao n — k .) Portanto, o teste 1 anterior pode ser 
empregado para testar a hipotese nula de que p 2 — 
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Aplique o teste t anterior para testar a hipotese de que os valores verdadeiros de fii e /it na re¬ 
gressao (C.10.14) sao identicos. 

Dica: utilize a matriz de variancias e covariancias de (3 dada da Equa£ao (C.10.9). 

C.4. Expressando correlagoes de ordem superior em termos de correlagoes de ordem inferior. Coe- 
ficientes de correlac^ao de ordem p podem ser expressos em termos de coeficientes de correla- 
gao de ordem p — 1 por meio da seguinte formula de reducao: 

^12,345...(p-l) _ [''lp,345...(p-l)''2p,345...0>-l)] 

''12,345. ..p ~ — , / 

V t 1 “ r fp,345...(p-l)]-v/[ 1 “ r 2p,345...(p- 1)] 


Assim, 


r 12 ~ r u r 2i 

7 1 - rf 3 y 1 - rf3 


conforme se verifica no Capitulo 7. 

Se voce tiver a seguinte matriz de correlacjao: 




Y X 2 

^3 

X4 

Xs 


Y 

' 1 0,44 

-0,34 

-0,31 

-0,14 


x 2 

1 

0,25 

-0,19 

-0,35 

R = 

X3 


1 

0,44 

0,33 


X 4 



1 

0,85 


X 5 




1 

Calcule 0 seguinte: 
a. r\ 2,345 


b. r*i 2,34 


c. 

r \ 2,3 

d. ''13,245 


e- ''13,24 


f 

n 3,2 


C.5. Expressando coeficientes de regressao de ordem superior em termos de coeficientes de regres¬ 
sao de ordem inferior. Um coeficiente de regressao de ordem p pode ser expresso em termos 
de um coeficiente de regressao de ordem p — 1 por meio da seguinte formula de rcdupao: 


2,345.. 


f\ 2,345...(/»- 1) “ \$lp,345...(p-\)$p2,345...(p-l)] 
1 “ /*2/>,345...(p-l)/^2,345...(p-l) 


Assim, 


fl2~ Pl3P32 
1 ~~ P23&32 


em que fi n ,3 e o coeficiente angular na regressao de y sobre X 2 , mantendo-se X 2 constante. De 
modo semelhante, f 12,34 e o coeficiente angular na regressao de Y sobre X 2 , mantendo-se X 3 e 
X 4 constantes, e assim por diante. 

Empregando a formula anterior, encontre expressoes para os seguintes coeficientes de regres¬ 
sao em termos de coeficientes de regressao de ordem inferior: /Sr2,3456, ^12,345 e ^12,34- 
C.6. Estabclepa a seguinte identidade: 

fil 2,3^23,1^3 1,2 = ''12,3^23,1^31,2 


C.7. Para a matriz de correlagao R da Equagao (C. 10.20), encontre todos os coeficientes de corre¬ 
lagao parcial de primeira ordem. 
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C.8. Ao estudar a variafao na taxa de criminalidade em algumas grandes cidades dos Estados Uni- 
dos, Ogburn obteve os seguintes dados:* 







Y 

X 2 

X 3 

X4 

^5 

Y = 

19,9 

Si = 

7,9 

Y 

' 1 

0,44 

-0,34 

-0,31 

-0,14 

x 2 = 

49,2 

S 2 = 

1,3 

X 2 


1 

0,25 

-0,19 

-0,35 

x 3 = 

10,2 

s 2 = 

4,6 

R= X 3 



1 

0,44 

0,33 

x 4 = 

481,4 

s 4 = 

74,4 

X 4 




1 

0,85 

X 5 = 

41,6 

S 5 = 

10,8 

X 5 





1 


em que Y — taxa de criminalidade, numero reportado de delitos conhecidos por mil habitantes. 

X 2 = porcentagem de habitantes do genero masculino 

X 3 — porcentagem de estrangeiros do genero masculino no total de habitantes 

X 4 — numero de crianyas com menos de 5 anos de idade por mil mulheres casadas com idade 
entre 15 e 44 anos 

X 5 = membros de igrejas, numero de membros de igrejas com 13 anos de idade ou mais como 
percentual da populapao total com 13 anos de idade ou mais; 5) a S 3 sao os desvios pa- 
drao da amostra das variaveis Y ate X 5 ; e R e matriz de concedes; 

a. Considerando Y a variavel dependente, calcule a regressao de Y sobre as quatro variaveis X 
e interprete a regressao estimada. 

b. Calcule r x 2j3 , r x 4>3 5 e r x 5>3 4 . 

c. Calcule R 2 e teste a hipotese de que todos os coeficientes angulares parciais sao simultanea- 
mente iguais a zero. 

C.9. A tabela a seguir fornece dados sobre a produ£ao e o custo total de produ£ao de uma mercado- 

ria a curto prazo: (Veja o Exemplo 7.4.) 


Produfao Custo total ($) 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 


193 

226 

240 

244 

257 

260 

274 

297 

350 

420 


Para testar se os dados anteriores indicam uma curva de custo medio na forma de U e uma 
curva de custo marginal semelhante a que encontramos normalmente a curto prazo, e possfvel 
utilizar o seguinte modelo: 

Yi = P i + PiX, + p 3 X 2 + faX* + Ut 

em que Y — custo total e X — produ 5 ao. As variaveis explanatorias 
de X. 

a. Expresse os dados na forma de desvio e calcule (X'X), (X'y) e 

b. Estime fa* @3 e Pa 

c. Estime a matriz de variancia e covariancia de (3. 

*OGBURN, W. F. "Factors in the variation of crime among cities." journal of American Statistical Association, 1935. 
v. 30, p. 12. 


adicionais X 2 e Xj derivam 
(X'X)- 1 . 
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d. Estime fa. Interprete fa no contexto do problema. 

e. Calcule R 2 e R 2 . 

f. A priori , quais os sinais de p 2 , e /J 4 ? Por que? 

g. Com base na furKjao de custo total dada anteriormente, calcule as expressoes para as fun- 
5 oes de custo medio e marginal. 

h. Adapte as funcoes de custo medio e marginal aos dados e comente a adapta 9 ao realizada. 

i. Se 3 — p 4 — 0, qual a natureza da funcao de custo marginal? Como voce testaria a hipotese de 
que f) 3 = p 4 = 0 ? 

j. Como voce poderia derivar as frn^oes de custo variavel total e de custo variavel medio 
dos dados fornecidos? 

C. 10. Com o objetivo de estudar a participayao da mao de obra das famflias pobres na zona urbana 

(famflias com renda abaixo de $ 3.943, em 1969), os dados da Tabela C.7 foram obtidos do 

Censo Populacional de 1970. 

a. Utilizando o modelo de regressao Y, = fi\ + @ 2 X 21 + ^ 3 X 3 , + /S 4 X 4 / + estime os coe- 
ficientes da regressao e interprete seus resultados. 

h. A priori, quais os sinais esperados dos coeficientes da regressao do modelo anterior e por que? 

c. Como voce testaria a hipotese de que a taxa global de desemprego nao tem nenhum efeito 
sobre a participayao da mao de obra pobre na zona urbana nos distritos censitarios forneci¬ 
dos pela tabela apresentada? 

d. Algumas variaveis do modelo anterior deveriam ser desconsideradas? Por que? 

e. Quais outras variaveis voce consideraria para incluir no modelo? 


TABELA C.7 

Distrito N° 

% na mao 

Renda media 

Tamanho medio 

Taxa de 

Participagao da mao 
de obra pobre da zona 
urbana: distritos 

137 

de obra 

64,3 

familiar, X 2 t 

1.998 

da famflia, X 3 

2,95 

desemprego, X 4 $ 

4,4 

censitarios, Nova 

139 

45,4 

1.114 

3,40 

3,4 

York, 1970 

141 

26,6 

1.942 

3,72 

1,1 

Fonte: Census Tracts: Nova 

York, Bureau of the Census, 

142 

87,5 

1.998 

4,43 

3,1 

U.S. Department of Com¬ 
merce, 1970. 

143 

71,3 

2.026 

3,82 

7,7 


145 

82,4 

1.853 

3,90 

5,0 


147 

26,3 

1.666 

3,32 

6,2 


149 

61,6 

1.434 

3,80 

5,4 


151 

52,9 

1.513 

3,49 

12,2 


153 

64,7 

2.008 

3,85 

4,8 


155 

64,9 

1.704 

4,69 

2,9 


157 

70,5 

1.525 

3,89 

4,8 


159 

87,2 

1.842 

3,53 

3,9 


161 

81,2 

1.735 

4,96 

7,2 


163 

67,9 

1.639 

3,68 

3,6 


* Y = chefes de famflia com menos de 65 anos de idade 
t X 2 = dolares 

t X 4 = percentual da mao de obra civil desempregada 


C. 11. Em uma aplicagao da fun 9 ao de produ 9 ao de Cobb-Douglas, foram obtidos os seguintes resul¬ 
tados: 
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lnT, = 2,3542 + 0,9576 lnX 2l + 0,8242 lnX 3 , 

(0,3022) (0,3571) 

R 2 = 0,8432 gl = 12 

em que Y — produgao, X 2 = insumo da mao de obra eX 3 = insumo de capital e os numeros 
entre parenteses sao os erros padrao estimados. 

a. Conforme observamos no Capitulo 7, os coeficientes dos insumos da mao de obra e do 
capital na equagao anterior fornecem as elasticidades da produgao com relagao a mao de 
obra e o capital. Teste a hipotese de que essas elasticidades sao individualmente iguais a 
unidade. 

b. Teste a hipotese de que as elasticidades da mao de obra e do capital sao iguais, admitindo 
(i) que a covariancia entre os coeficientes estimados da mao de obra e do capital seja zero 
e ( ii) que a covariancia seja —0,0972. 

c. Como voce testaria a significancia global da equagao de regressao precedente? 

*C.12.Expresse a fungao de verossimilhanga para o modelo de regressao com k variaveis na notagao 

matricial e mostre que [), o vetor dos estimadores de maxima verossimilhanga, e identico a (3. 
o vetor dos estimadores de MQO do modelo de regressao com k variaveis. 

C.13.Regressao por meio de variaveis padronizadas. Considere as seguintes funcoes de regressao 
amostral (FRA): 


Yi — $\ + P 2 X 2i + p 2 X 2i + Ui 

(i) 

y; = b< + b 2 x’ 2l + b 3 x; t + a* 

(2) 


em que 


y; = 

Yt- Y 

sr 


^ 2 , = 

x 2l - X 2 

S2 

Y* - 

X 3i - X 3 

A 3 i 

s 3 


em que os s denotam os desvios padrao. Conforme observamos no Capitulo 6, Segao 6.3, as 
variaveis assinaladas sao conhecidas como variaveis padronizadas. Estas possuem media zero 
e desvio padrao unitario (= 1). Expressando todas as variaveis na forma de desvios, mostre o 
seguinte para o modelo (2): 


a. X X = 


1 

ri-i 


^23 

1 


n 


b. X'y = 


r 12 

r\3 


n 


/ v -i_ 1 r 1 ~ r 23 

-r 23 1 

r\2 - ^23^13 
r\3 ~ r 2 ir l2 


«(! - r h) 


b 2 

1 

b 3 

I - r 2 

1 r 7.3 


Opcional. 
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e. b i=0 

Estabele 5 a tambem a rcla^'ao entre os b e os ft. (Observe que, nas redoes anteriores, n denota 
o tamanho da amostra; r 12 , r 13 e r 23 denotam as correlagoes entre Y e X 2 , entre fel 3 e entre X 2 
e X 2 , respectivamente). 

C.14. Verifique as Equa 9 oes (C.10.18) e (C.10.19). 

*C.15 .Mmimos quadrados restritos. Suponha que 

y=Xp+u (1 ) 

que desejamos estimar, submetendo as igualdades a uma serie de restrigoes ou limita 9 oes: 

RP = r (2) 

em que R e uma matriz conhecida de ordem qxk ( q < k) e r e um vetor conhecido de q ele- 
mentos. Para ilustrar, suponha que nosso modelo seja 

Yi = ft 1 + ft2%2 i + ftlX-ii + ft 4 X 4 i + ftsXst + M, 

e suponha que desejemos estimar esse modelo submetido a estas restr^oes: 

fti ~ fti = 0 

ftA + ft5 = 1 (5) 

Podemos utilizar algumas das tecnicas discutidas no Capftulo 8 para incorporar essas restri- 
9 oes (por exemplo, ft 2 = ft 2 e ft 4 = 1 — ft 5 , removendo, assim, ft 2 e ft 4 do modelo) e testar a 
validade dessas restri 9 oes empregando o teste F discutido. Mas uma maneira mais direta de 
estimar a Equa 9 ao (3) incorporando as restr^oes (4) diretamente no procedimento de estima- 
9 ao consiste em primeiro expressar as restri 9 oes na forma da Equa 9 ao ( 2 ), que, neste caso, 
torna-se: 


'0 1 

- 1 o o' 


'o' 

1 - 

O 

o 

011 

r — 

1 


( 5 ) 


Com |3 denotando o estimador de mmimos quadrados restritos ou estimador dos mmimos 
quadrados sem restri 9 oes, e possrvel mostrar que p pode ser estimado por meio da seguinte 
formula: 


P* = p + (X'X)“ ^'[RCX'X) - ‘r'] - *(r - R) (6) 

em que p e o estimador usual (sem restri 9 oes) estimado por meio da formula usual (X'X)” 1 

X'y. 

a. Qual o vetor ft na Equa 9 ao (3)? 

b. Dado o vetor ft, verifique se a matriz R e o vetor r da Equa 9 ao (5) realmente incorporam as 
restri 9 oes da Equa 9 ao (4). 

c. Especifique o R e r para os seguintes casos: 


‘Opcional 

f Veja Johnston, J. op. cit., p. 205. 
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(0 Pi — Pi — ft — 2 

(ii) p 2 = ft e ft = ft 
(Hi) p 2 — 3ft = 5 ft 
(iv) P 2 + 3ft = 0 
d. Quando ocorrera o caso P* = P? 


Apendice CA 


CA.1 Deriva^ao de k equates normais ou simultaneas 

Ao diferenciarmos 

= E (y ' - ft - PiX2i -ft 2ft) 2 


parcialmente em rela^ao a ft, ft, ■ ■ ■ , ft, obtemos 


dPl 

9 E 

9ft 


2^(7 - ft - PiX 2i -ft2ft)(- 1) 

2^(7 -ft - ftX 2 , - - ft2ft)(-2ft) 


9ft 


2^(7 - ft - ftjft- PkXki)(-X ki ) 


Ao mantermos as derivadas parciais anteriores iguais a zero e ao reordenarmos os termos, obtemos as k equa¬ 
tes normais apresentadas na Equagao (C.3.8). 


CA.2 Deriva^ao matricial de equates normais 


A partir da Equagao (C.3.7), obtemos 

u'u = y'y - 2p'X'y + jj'X'Xp 

Usando as regras de diferenciacao de matrizes apresentadas no Apendice B, Sc^ao B.6, obtemos 


9(u'u) 

~w 


2X'y + 2X'Xp 


Mantendo a equajao anterior igual a zero, obtemos 

(X'X)p = X'y 

em que P = (X'Xft 1 X'y, sob a condi§ao de que a matriz inversa exista. 

CA.3 Matriz de variancias e covariancias de p 

A partir da Equafao (C.3.11), obtemos 

P = (X'X)-'x'y 
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Ao substituirmos y = X(3 + u na expressao anterior, temos 

P = (X'X)" 1 X'(X|3+ u) 

= (X'xr‘x'xp+ (X'X) _1 X'u 

= p + (X'X)-'X'U (1) 

Portanto, 

P~ P = (X'X)-'X'U (2) 

Por definigao 


var-cov(P) = £[(|3- P)(j}- P)'] 

= ,E{[(X'X) _ ’x'u][(X'X) _ ‘X'u]'} (3) 

= £[(X'X)“ 1 X'uu'X(X'X)“ 1 ] 

em que, no ultimo passo, aproveita-se o fato de que (AB)' = B'A'. Observando que os X sao nao estocasticos, 
tendo em perspectiva a Equagao (3), obtemos 

var-cov(P) = (X'X)“ 1 X'£ , (uu')X(X'X)“ 1 
= (X'X)~ 1 XV 2 IX(X'X) _ 1 
= <t 2 (X'X) _1 

que e o resultado fomecido na Equagao (C.3.13). Observe que, ao derivarmos o resultado anterior, utilizamo-nos 
da hipotese de que ii(uu') = o 2 !. 


CA.4 Propriedade de melhor estimador linear nao viesado 
(MELNT) dos estimadores de rmnimos quadrados 
ordinarios (MQO) 


Por meio da Equagao (C.3.11), temos 

P= (X'X)-'X'y 

Na rnedida em que (X'X) -1 X' e uma matriz de numeros fixos, P e uma fungao linear de Y. Sendo assim, 
constitui um estimador linear por definigao. 

Lembre-se de que a fungao de regressao populacional (FRP) e 

y = Xp + u ( 2 ) 

Substituindo-a na Equagao (1), obtemos 

p= (X'X)- 1 X'(XP+u) (3) 

= P + (X'X)-'X'U (4) 

na rnedida em que (X'X)~* X' X = I. 

Adotando a expectativa da Equagao (4), obtemos 


£(p)= £(P)+ (X'X)-‘X'£(U) 

= P 


( 5 ) 
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na medida em que £((3) = (3 (por que?) e £(u) = 0 por hipotese, o que mostra que P e um estimador nao vie- 
sado de p. 

Sendo P* qualquer outro estimador linear de P, o que pode ser escrito como 

p* = [(X'X)- 1 X'+ C]y ( 6 ) 


em que C e a matriz de constantes. 

Ao substituirmos o y da Equapao (2) na Equapao (6), temos 

P* = [(X'X) _1 X' + C](XP+ u) 

= P+ CXP+ (X'X) _1 X'u+ Cu 

Agora, para que p* seja um estimador nao viesado de p, precisamos ter 

CX = 0 (Por que?) 

Ao utilizarmos a Equapao (8), a Equapao (7) pode ser escrita do seguinte modo 

P* - P = (X'X) _1 X'u+ Cu 

Por definipao, a matriz de variancias e covariancias de (p*) e 

£(j3* - P)(P* - p)' = £[(X'X)“ 1 X'u+ Cu][(X'X)“ 1 X'u+ Cu]' 


( 7 ) 

( 8 ) 

( 9 ) 


( 10 ) 


Ao empregarmos as propriedades da inversao e da transposipao de matrizes, e apos simplificapoes algebri- 
cas, obtemos 


var-cov(B*) = a 2 (X'X) _1 + a 2 CC' 

( 11 ) 

= var-cov(P) + a 2 CC' 

o que mostra que a matriz de variancias e covariancias do estimador linear nao viesado p* e igual a matriz de 
variancias e covariancias do estimador dos minimos quadrados ordinarios P mais rr multiplicado por CC, o 
qual e uma matriz positiva semidefinida'. Sendo assim, as variancias de determinado elemento de P* devem 
necessariamente ser iguais ou maiores do que o elemento correspondente P, que mostra que Pcorresponde a um 
melhor estimador linear nao viesado (MELNT). Certamente, seCe uma matriz nula, isto e, C = 0, entao P*= 
p o que constitui uma outra forma de dizer que (juando encontramos um melhor estimador linear nao viesado 
ele deve ser o estimador de mmimos quadrados p. 


Veja as referencias no Apendice B. 



Apendice 


Tabelas estatisticas 


Tabela D.l 
Tabela D.2 
Tabela D.3 
Tabela D.4 
Tabela D.5A 

Tabela D.5B 

Tabela D.6A e D.6B 
Tabela D.7 


Areas sob a distribuigao normal padronizada 
Pontos percentuais da distribuigao 1 
Pontos percentuais superiores da distribuigao F 
Pontos percentuais superiores da distribuigao yj 

Estatfstica d de Durbin-Watson: pontos de significancia de d L e d v em nfveis de 
significancia de 0,05 

Estatfstica d de Durbin-Watson: pontos de significancia de d L e d v em nfveis de 
significancia de 0,01 

Valores crfticos de runs no teste dos funcionamentos 

Valores crfticos de t (— r) de Dickey-Fuller a 1% e 5% e valores de F para testes 
de raiz unitaria 
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TABELA D.1 

Areas sob a 
distribuigao normal 
padronizada 


Exemplo 

Pr (0< Z< 1,96) = 0,4750 

Pr(Z >1,96) = 0,5 - 0,4750 = 0,025 




Nota: esta tabela da a area na cauda direita da distribuigao (Z > 0). Mas, visto que a distribuigao normal e simetrica ao redor de Z = 0, a area na 
cauda esquerda e igual a area na cauda direita correspondente. Por exemplo, P(— 1,96 < Z < 0) = 0,4750. Portanto, P(— 1,96 < Z < 1,96) = 
2(0,4750) = 0,95. 
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Tabelas estatisticas 


TABELA D.2 

Pontos percentuais 
da distribui§ao t 


Exemplo 

Pr(t > 2,086) = 0,025 

Pr(f >1,725) = 0,05 para gl = 20 

Pr(|fj > 1,725) = 0,10 



Nv / 

gN 

0,25 

0,50 

0,10 

0,20 

0,05 

0,10 

0,025 

0,05 

0,01 

0,02 

0,005 

0,010 

0,001 

0,002 

i 

1,000 

3,078 

6,314 

12,706 

31,821 

63,657 

318,31 

2 

0,816 

1,886 

2,920 

4,303 

6,965 

9,925 

22,327 

3 

0,765 

1,638 

2,353 

3,182 

4,541 

5,841 

10,214 

4 

0,741 

1,533 

2,132 

2,776 

3,747 

4,604 

7,173 

5 

0,727 

1,476 

2,015 

2,571 

3,365 

4,032 

5,893 

6 

0,718 

1,440 

1,943 

2,447 

3,143 

3,707 

5,208 

7 

0,711 

1,415 

1,895 

2,365 

2,998 

3,499 

4,785 

8 

0,706 

1,397 

1,860 

2,306 

2,896 

3,355 

4,501 

9 

0,703 

1,383 

1,833 

2,262 

2,821 

3,250 

4,297 

10 

0,700 

1,372 

1,812 

2,228 

2,764 

3,169 

4,144 

11 

0,697 

1,363 

1,796 

2,201 

2,718 

3,106 

4,025 

12 

0,695 

1,356 

1,782 

2,179 

2,681 

3,055 

3,930 

13 

0,694 

1,350 

1,771 

2,160 

2,650 

3,012 

3,852 

14 

0,692 

1,345 

1,761 

2,145 

2,624 

2,977 

3,787 

15 

0,691 

1,341 

1,753 

2,131 

2,602 

2,947 

3,733 

16 

0,690 

1,337 

1,746 

2,120 

2,583 

2,921 

3,686 

17 

0,689 

1,333 

1,740 

2,110 

2,567 

2,898 

3,646 

18 

0,688 

1,330 

1,734 

2,101 

2,552 

2,878 

3,610 

19 

0,688 

1,328 

1,729 

2,093 

2,539 

2,861 

3,579 

20 

0,687 

1,325 

1,725 

2,086 

2,528 

2,845 

3,552 

21 

0,686 

1,323 

1,721 

2,080 

2,518 

2,831 

3,527 

22 

0,686 

1,321 

1,717 

2,074 

2,508 

2,819 

3,505 

23 

0,685 

1,319 

1,714 

2,069 

2,500 

2,807 

3,485 

24 

0,685 

1,318 

1,711 

2,064 

2,492 

2,797 

3,467 

25 

0,684 

1,316 

1,708 

2,060 

2,485 

2,787 

3,450 

26 

0,684 

1,315 

1,706 

2,056 

2,479 

2,779 

3,435 

27 

0,684 

1,314 

1,703 

2,052 

2,473 

2,771 

3,421 

28 

0,683 

1,313 

1,701 

2,048 

2,467 

2,763 

3,408 

29 

0,683 

1,311 

1,699 

2,045 

2,462 

2,756 

3,396 

30 

0,683 

1,310 

1,697 

2,042 

2,457 

2,750 

3,385 

40 

0,681 

1,303 

1,684 

2,021 

2,423 

2,704 

3,307 

60 

0,679 

1,296 

1,671 

2,000 

2,390 

2,660 

3,232 

120 

0,677 

1,289 

1,658 

1,980 

2,358 

2,617 

3,160 

00 

0,674 

1,282 

1,645 

1,960 

2,326 

2,576 

3,090 


Fonte: PEARSON, E. S.; HARTLEY, H. O. (Eds.). Biometrika tables for statisticians. 3. ed. Nova York: Cambridge University Press, 1966. v. 1, 
tabela 12. Reprodi^ao autorizada pelos editores e curadores da Biometrika. 

Nota: a menor probabilidade mostrada no titulo de cada coluna e a area em uma cauda; a probabilidade maior e a area em ambas as caudas. 
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TABELA D.3 Exemplo 

Pontos porcentuais Pr(F > 1,59) = 0,25 

superiores da P r (P > 2,42) = 0,1 0 para gl N-\ = 10 

distribuifao F Pr(F> 3,14) = 0,05 e N 2 = 9 

Pr(F > 5,26) = 0,01 



gl para numerador Nf 

Pr 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

0,25 

5,83 

7,50 

8,20 

8,58 

8,82 

8,98 

9,10 

9,19 

9,26 

9,32 

9,36 

9,41 

0,10 

39,9 

49,5 

53,6 

55,8 

57,2 

58,2 

58,9 

59,4 

59,9 

60,2 

60,5 

60,7 

0,05 

161 

200 

216 

225 

230 

234 

237 

239 

241 

242 

243 

244 

0,25 

2,57 

3,00 

3,15 

3,23 

3,28 

3,31 

3,34 

3,35 

3,37 

3,38 

3,39 

3,39 

0,10 

8,53 

9,00 

9,16 

9,24 

9,29 

9,33 

9,35 

9,37 

9,38 

9,39 

9,40 

9,41 

0,05 

18,5 

19,0 

19,2 

19,2 

19,3 

19,3 

19,4 

19,4 

19,4 

19,4 

19,4 

19,4 

0,01 

98,5 

99,0 

99,2 

99,2 

99,3 

99,3 

99,4 

99,4 

99,4 

99,4 

99,4 

99,4 

0,25 

2,02 

2,28 

2,36 

2,39 

2,41 

2,42 

2,43 

2,44 

2,44 

2,44 

2,45 

2,45 

0,10 

5,54 

5,46 

5,39 

5,34 

5,31 

5,28 

5,27 

5,25 

5,24 

5,23 

5,22 

5,22 

0,05 

10,1 

9,55 

9,28 

9,12 

9,01 

8,94 

8,89 

8,85 

8,81 

8,79 

8,76 

8,74 

0,01 

34,1 

30,8 

29,5 

28,7 

28,2 

27,9 

27,7 

27,5 

27,3 

27,2 

27,1 

27,1 

0,25 

1,81 

2,00 

2,05 

2,06 

2,07 

2,08 

2,08 

2,08 

2,08 

2,08 

2,08 

2,08 

0,10 

4,54 

4,32 

4,19 

4,11 

4,05 

4,01 

3,98 

3,95 

3,94 

3,92 

3,91 

3,90 

0,05 

7,71 

6,94 

6,59 

6,39 

6,26 

6,16 

6,09 

6,04 

6,00 

5,96 

5,94 

5,91 

0,01 

21,2 

18,0 

16,7 

16,0 

15,5 

15,2 

15,0 

14,8 

14,7 

14,5 

14,4 

14,4 

0,25 

1,69 

1,85 

1,88 

1,89 

1,89 

1,89 

1,89 

1,89 

1,89 

1,89 

1,89 

1,89 

0,10 

4,06 

3,78 

3,62 

3,52 

3,45 

3,40 

3,37 

3,34 

3,32 

3,30 

3,28 

3,27 

0,05 

6,61 

5,79 

5,41 

5,19 

5,05 

4,95 

4,88 

4,82 

4,77 

4,74 

4,71 

4,68 

0,01 

16,3 

13,3 

12,1 

11,4 

11,0 

10,7 

10,5 

10,3 

10,2 

10,1 

9,96 

9,89 

0,25 

1,62 

1,76 

1,78 

1,79 

1,79 

1,78 

1,78 

1,78 

1,77 

1,77 

1,77 

1,77 

0,10 

3,78 

3,46 

3,29 

3,18 

3,11 

3,05 

3,01 

2,98 

2,96 

2,94 

2,92 

2,90 

0,05 

5,99 

5,14 

4,76 

4,53 

4,39 

4,28 

4,21 

4,15 

4,10 

4,06 

4,03 

4,00 

0,01 

13,7 

10,9 

9,78 

9,15 

8,75 

8,47 

8,26 

8,10 

7,98 

7,87 

7,79 

7,72 

0,25 

1,57 

1,70 

1,72 

1,72 

1,71 

1,71 

1,70 

1,70 

1,69 

1,69 

1,69 

1,68 

0,10 

3,59 

3,26 

3,07 

2,96 

2,88 

2,83 

2,78 

2,75 

2,72 

2,70 

2,68 

2,67 

0,05 

5,59 

4,74 

4,35 

4,12 

3,97 

3,87 

3,79 

3,73 

3,68 

3,64 

3,60 

3,57 

0,01 

12,2 

9,55 

8,45 

7,85 

7,46 

7,19 

6,99 

6,84 

6,72 

6,62 

6,54 

6,47 

0,25 

1,54 

1,66 

1,67 

1,66 

1,66 

1,65 

1,64 

1,64 

1,63 

1,63 

1,63 

1,62 

0,10 

3,46 

3,11 

2,92 

2,81 

2,73 

2,67 

2,62 

2,59 

2,56 

2,54 

2,52 

2,50 

0,05 

5,32 

4,46 

4,07 

3,84 

3,69 

3,58 

3,50 

3,44 

3,39 

3,35 

3,31 

3,28 

0,01 

11,3 

8,65 

7,59 

7,01 

6,63 

6,37 

6,18 

6,03 

5,91 

5,81 

5,73 

5,67 

0,25 

1,51 

1,62 

1,63 

1,63 

1,62 

1,61 

1,60 

1,60 

1,59 

1,59 

1,58 

1,58 

0,10 

3,36 

3,01 

2,81 

2,69 

2,61 

2,55 

2,51 

2,47 

2,44 

2,42 

2,40 

2,38 

0,05 

5,12 

4,26 

3,86 

3,63 

3,48 

3,37 

3,29 

3,23 

3,18 

3,14 

3,10 

3,07 

0,01 

10,6 

8,02 

6,99 

6,42 

6,06 

5,80 

5,61 

5,47 

5,35 

5,26 

5,18 

5,11 


gl para 
denominador 

N 2 


Fonte: PEARSON, E. S.; HARTLEY, H. O. (Eds.). Biometrika tables for statisticians. 3. 
autorizada pelos editores e curadores da Biometrika. 


ed. Nova York: Cambridge University Press, 1966. v. 1, tabela 12. Reprodu^ao 
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TABELA D.3 ( Continuagao ) 


gl para 

gl para numerador N | 

denomi- 
nador N 2 

Pr 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


0,25 

1,49 

1,60 

1,60 

1,59 

1,59 

1,58 

1,57 

1,56 

1,56 

1,55 

1,55 

1,54 


0,10 

3,29 

2,92 

2,73 

2,61 

2,52 

2,46 

2,41 

2,38 

2,35 

2,32 

2,30 

2,28 

10 

0,05 

4,96 

4,10 

3,71 

3,48 

3,33 

3,22 

3,14 

3,07 

3,02 

2,98 

2,94 

2,91 


0,01 

10,0 

7,56 

6,55 

5,99 

5,64 

5,39 

5,20 

5,06 

4,94 

4,85 

4,77 

4,71 


0,25 

1,47 

1,58 

1,58 

1,57 

1,56 

1,55 

1,54 

1,53 

1,53 

1,52 

1,52 

1,51 


0,10 

3,23 

2,86 

2,66 

2,54 

2,45 

2,39 

2,34 

2,30 

2,27 

2,25 

2,23 

2,21 

11 

0,05 

4,84 

3,98 

3,59 

3,36 

3,20 

3,09 

3,01 

2,95 

2,90 

2,85 

2,82 

2,79 

0,01 

9,65 

7,21 

6,22 

5,67 

5,32 

5,07 

4,89 

4,74 

4,63 

4,54 

4,46 

4,40 


0,25 

1,46 

1,56 

1,56 

1,55 

1,54 

1,53 

1,52 

1,51 

1,51 

1,50 

1,50 

1,49 


0,10 

3,18 

2,81 

2,61 

2,48 

2,39 

2,33 

2,28 

2,24 

2,21 

2,19 

2,17 

2,15 

12 

0,05 

4,75 

3,89 

3,49 

3,26 

3,11 

3,00 

2,91 

2,85 

2,80 

2,75 

2,72 

2,69 

0,01 

9,33 

6,93 

5,95 

5,41 

5,06 

4,82 

4,64 

4,50 

4,39 

4,30 

4,22 

4,16 


0,25 

1,45 

1,55 

1,55 

1,53 

1,52 

1,51 

1,50 

1,49 

1,49 

1,48 

1,47 

1,47 


0,10 

3,14 

2,76 

2,56 

2,43 

2,35 

2,28 

2,23 

2,20 

2,16 

2,14 

2,12 

2,10 

13 

0,05 

4,67 

3,81 

3,41 

3,18 

3,03 

2,92 

2,83 

2,77 

2,71 

2,67 

2,63 

2,60 

0,01 

9,07 

6,70 

5,74 

5,21 

4,86 

4,62 

4,44 

4,30 

4,19 

4,10 

4,02 

3,96 


0,25 

1,44 

1,53 

1,53 

1,52 

1,51 

1,50 

1,49 

1,48 

1,47 

1,46 

1,46 

1,45 


0,10 

3,10 

2,73 

2,52 

2,39 

2,31 

2,24 

2,19 

2,15 

2,12 

2,10 

2,08 

2,05 

14 

0,05 

4,60 

3,74 

3,34 

3,11 

2,96 

2,85 

2,76 

2,70 

2,65 

2,60 

2,57 

2,53 

0,01 

8,86 

6,51 

5,56 

5,04 

4,69 

4,46 

4,28 

4,14 

4,03 

3,94 

3,86 

3,80 


0,25 

1,43 

1,52 

1,52 

1,51 

1,49 

1,48 

1,47 

1,46 

1,46 

1,45 

1,44 

1,44 


0,10 

3,07 

2,70 

2,49 

2,36 

2,27 

2,21 

2,16 

2,12 

2,09 

2,06 

2,04 

2,02 

15 

0,05 

4,54 

3,68 

3,29 

3,06 

2,90 

2,79 

2,71 

2,64 

2,59 

2,54 

2,51 

2,48 

0,01 

8,68 

6,36 

5,42 

4,89 

4,56 

4,32 

4,14 

4,00 

3,89 

3,80 

3,73 

3,67 


0,25 

1,42 

1,51 

1,51 

1,50 

1,48 

1,47 

1,46 

1,45 

1,44 

1,44 

1,44 

1,43 


0,10 

3,05 

2,67 

2,46 

2,33 

2,24 

2,18 

2,13 

2,09 

2,06 

2,03 

2,01 

1,99 

16 

0,05 

4,49 

3,63 

3,24 

3,01 

2,85 

2,74 

2,66 

2,59 

2,54 

2,49 

2,46 

2,42 

0,01 

8,53 

6,23 

5,29 

4,77 

4,44 

4,20 

4,03 

3,89 

3,78 

3,69 

3,62 

3,55 


0,25 

1,42 

1,51 

1,50 

1,49 

1,47 

1,46 

1,45 

1,44 

1,43 

1,43 

1,42 

1,41 


0,10 

3,03 

2,64 

2,44 

2,31 

2,22 

2,15 

2,10 

2,06 

2,03 

2,00 

1,98 

1,96 

17 

0,05 

4,45 

3,59 

3,20 

2,96 

2,81 

2,70 

2,61 

2,55 

2,49 

2,45 

2,41 

2,38 

0,01 

8,40 

6,11 

5,18 

4,67 

4,34 

4,10 

3,93 

3,79 

3,68 

3,59 

3,52 

3,46 


0,25 

1,41 

1,50 

1,49 

1,48 

1,46 

1,45 

1,44 

1,43 

1,42 

1,42 

1,41 

1,40 


0,10 

3,01 

2,62 

2,42 

2,29 

2,20 

2,13 

2,08 

2,04 

2,00 

1,98 

1,96 

1,93 

18 

0,05 

4,41 

3,55 

3,16 

2,93 

2,77 

2,66 

2,58 

2,51 

2,46 

2,41 

2,37 

2,34 

0,01 

8,29 

6,01 

5,09 

4,58 

4,25 

4,01 

3,84 

3,71 

3,60 

3,51 

3,43 

3,37 


0,25 

1,41 

1,49 

1,49 

1,47 

1,46 

1,44 

1,43 

1,42 

1,41 

1,41 

1,40 

1,40 


0,10 

2,99 

2,61 

2,40 

2,27 

2,18 

2,11 

2,06 

2,02 

1,98 

1,96 

1,94 

1,91 

19 

0,05 

4,38 

3,52 

3,13 

2,90 

2,74 

2,63 

2,54 

2,48 

2,42 

2,38 

2,34 

2,31 

0,01 

8,18 

5,93 

5,01 

4,50 

4,17 

3,94 

3,77 

3,63 

3,52 

3,43 

3,36 

3,30 


0,25 

1,40 

1,49 

1,48 

1,46 

1,45 

1,44 

1,43 

1,42 

1,41 

1,40 

1,39 

1,39 


0,10 

2,97 

2,59 

2,38 

2,25 

2,16 

2,09 

2,04 

2,00 

1,96 

1,94 

1,92 

1,89 

20 

0,05 

4,35 

3,49 

3,10 

2,87 

2,71 

2,60 

2,51 

2,45 

2,39 

2,35 

2,31 

2,28 


0,01 

8,10 

5,85 

4,94 

4,43 

4,10 

3,87 

3,70 

3,56 

3,46 

3,37 

3,29 

3,23 


( Continua ) 
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TABELA D.3 ( Continuaqao ) 


gl para numerador Nt 

gl para 














denomi- 

15 

20 

24 

30 

40 

50 

60 

100 

120 

200 

500 

00 

Pr 

nador N 2 

1,53 

1,52 

1,52 

1,51 

1,51 

1,50 

1,50 

1,49 

1,49 

1,49 

1,48 

1,48 

0,25 


2,24 

2,20 

2,18 

2,16 

2,13 

2,12 

2,11 

2,09 

2,08 

2,07 

2,06 

2,06 

0,10 

10 

2,85 

2,77 

2,74 

2,70 

2,66 

2,64 

2,62 

2,59 

2,58 

2,56 

2,55 

2,54 

0,05 

4,56 

4,41 

4,33 

4,25 

4,17 

4,12 

4,08 

4,01 

4,00 

3,96 

3,93 

3,91 

0,01 


1,50 

1,49 

1,49 

1,48 

1,47 

1,47 

1,47 

1,46 

1,46 

1,46 

1,45 

1,45 

0,25 


2,17 

2,12 

2,10 

2,08 

2,05 

2,04 

2,03 

2,00 

2,00 

1,99 

1,98 

1,97 

0,10 

11 

2,72 

2,65 

2,61 

2,57 

2,53 

2,51 

2,49 

2,46 

2,45 

2,43 

2,42 

2,40 

0,05 

4,25 

4,10 

4,02 

3,94 

3,86 

3,81 

3,78 

3,71 

3,69 

3,66 

3,62 

3,60 

0,01 


1,48 

1,47 

1,46 

1,45 

1,45 

1,44 

1,44 

1,43 

1,43 

1,43 

1,42 

1,42 

0,25 


2,10 

2,06 

2,04 

2,01 

1,99 

1,97 

1,96 

1,94 

1,93 

1,92 

1,91 

1,90 

0,10 

12 

2,62 

2,54 

2,51 

2,47 

2,43 

2,40 

2,38 

2,35 

2,34 

2,32 

2,31 

2,30 

0,05 

4,01 

3,86 

3,78 

3,70 

3,62 

3,57 

3,54 

3,47 

3,45 

3,41 

3,38 

3,36 

0,01 


1,46 

1,45 

1,44 

1,43 

1,42 

1,42 

1,42 

1,41 

1,41 

1,40 

1,40 

1,40 

0,25 


2,05 

2,01 

1,98 

1,96 

1,93 

1,92 

1,90 

1,88 

1,88 

1,86 

1,85 

1,85 

0,10 

13 

2,53 

2,46 

2,42 

2,38 

2,34 

2,31 

2,30 

2,26 

2,25 

2,23 

2,22 

2,21 

0,05 

3,82 

3,66 

3,59 

3,51 

3,43 

3,38 

3,34 

3,27 

3,25 

3,22 

3,19 

3,17 

0,01 


1,44 

1,43 

1,42 

1,41 

1,41 

1,40 

1,40 

1,39 

1,39 

1,39 

1,38 

1,38 

0,25 


2,01 

1,96 

1,94 

1,91 

1,89 

1,87 

1,86 

1,83 

1,83 

1,82 

1,80 

1,80 

0,10 

14 

2,46 

2,39 

2,35 

2,31 

2,27 

2,24 

2,22 

2,19 

2,18 

2,16 

2,14 

2,13 

0,05 

3,66 

3,51 

3,43 

3,35 

3,27 

3,22 

3,18 

3,11 

3,09 

3,06 

3,03 

3,00 

0,01 


1,43 

1,41 

1,41 

1,40 

1,39 

1,39 

1,38 

1,38 

1,37 

1,37 

1,36 

1,36 

0,25 


1,97 

1,92 

1,90 

1,87 

1,85 

1,83 

1,82 

1,79 

1,79 

1,77 

1,76 

1,76 

0,10 

15 

2,40 

2,33 

2,29 

2,25 

2,20 

2,18 

2,16 

2,12 

2,11 

2,10 

2,08 

2,07 

0,05 

3,52 

3,37 

3,29 

3,21 

3,13 

3,08 

3,05 

2,98 

2,96 

2,92 

2,89 

2,87 

0,01 


1,41 

1,40 

1,39 

1,38 

1,37 

1,37 

1,36 

1,36 

1,35 

1,35 

1,34 

1,34 

0,25 


1,94 

1,89 

1,87 

1,84 

1,81 

1,79 

1,78 

1,76 

1,75 

1,74 

1,73 

1,72 

0,10 

16 

2,35 

2,28 

2,24 

2,19 

2,15 

2,12 

2,11 

2,07 

2,06 

2,04 

2,02 

2,01 

0,05 

3,41 

3,26 

3,18 

3,10 

3,02 

2,97 

2,93 

2,86 

2,84 

2,81 

2,78 

2,75 

0,01 


1,40 

1,39 

1,38 

1,37 

1,36 

1,35 

1,35 

1,34 

1,34 

1,34 

1,33 

1,33 

0,25 


1,91 

1,86 

1,84 

1,81 

1,78 

1,76 

1,75 

1,73 

1,72 

1,71 

1,69 

1,69 

0,10 

17 

2,31 

2,23 

2,19 

2,15 

2,10 

2,08 

2,06 

2,02 

2,01 

1,99 

1,97 

1,96 

0,05 

3,31 

3,16 

3,08 

3,00 

2,92 

2,87 

2,83 

2,76 

2,75 

2,71 

2,68 

2,65 

0,01 


1,39 

1,38 

1,37 

1,36 

1,35 

1,34 

1,34 

1,33 

1,33 

1,32 

1,32 

1,32 

0,25 


1,89 

1,84 

1,81 

1,78 

1,75 

1,74 

1,72 

1,70 

1,69 

1,68 

1,67 

1,66 

0,10 

18 

2,27 

2,19 

2,15 

2,11 

2,06 

2,04 

2,02 

1,98 

1,97 

1,95 

1,93 

1,92 

0,05 

3,23 

3,08 

3,00 

2,92 

2,84 

2,78 

2,75 

2,68 

2,66 

2,62 

2,59 

2,57 

0,01 


1,38 

1,37 

1,36 

1,35 

1,34 

1,33 

1,33 

1,32 

1,32 

1,31 

1,31 

1,30 

0,25 


1,86 

1,81 

1,79 

1,76 

1,73 

1,71 

1,70 

1,67 

1,67 

1,65 

1,64 

1,63 

0,10 

19 

2,23 

2,16 

2,11 

2,07 

2,03 

2,00 

1,98 

1,94 

1,93 

1,91 

1,89 

1,88 

0,05 

3,15 

3,00 

2,92 

2,84 

2,76 

2,71 

2,67 

2,60 

2,58 

2,55 

2,51 

2,49 

0,01 


1,37 

1,36 

1,35 

1,34 

1,33 

1,33 

1,32 

1,31 

1,31 

1,30 

1,30 

1,29 

0,25 


1,84 

1,79 

1,77 

1,74 

1,71 

1,69 

1,68 

1,65 

1,64 

1,63 

1,62 

1,61 

0,10 


2,20 

2,12 

2,08 

2,04 

1,99 

1,97 

1,95 

1,91 

1,90 

1,88 

1,86 

1,84 

0,05 

20 

3,09 

2,94 

2,86 

2,78 

2,69 

2,64 

2,61 

2,54 

2,52 

2,48 

2,44 

2,42 

0,01 



( Continua ) 
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gl para 






gl para numerador Nf 






denominador 

n 2 

Pr 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


0,25 

1,40 

1,48 

1,47 

1,45 

1,44 

1,42 

1,41 

1,40 

1,39 

1,39 

1,38 

1,37 


0,10 

2,95 

2,56 

2,35 

2,22 

2,13 

2,06 

2,01 

1,97 

1,93 

1,90 

1,88 

1,86 

22 







0,05 

4,30 

3,44 

3,05 

2,82 

2,66 

2,55 

2,46 

2,40 

2,34 

2,30 

2,26 

2,23 


0,01 

7,95 

5,72 

4,82 

4,31 

3,99 

3,76 

3,59 

3,45 

3,35 

3,26 

3,18 

3,12 


0,25 

1,39 

1,47 

1,46 

1,44 

1,43 

1,41 

1,40 

1,39 

1,38 

1,38 

1,37 

1,36 


0,10 

2,93 

2,54 

2,33 

2,19 

2,10 

2,04 

1,98 

1,94 

1,91 

1,88 

1,85 

1,83 

24 

0,05 

4,26 

3,40 

3,01 

2,78 

2,62 

2,51 

2,42 

2,36 

2,30 

2,25 

2,21 

2,18 


0,01 

7,82 

5,61 

4,72 

4,22 

3,90 

3,67 

3,50 

3,36 

3,26 

3,17 

3,09 

3,03 


0,25 

1,38 

1,46 

1,45 

1,44 

1,42 

1,41 

1,39 

1,38 

1,37 

1,37 

1,36 

1,35 


0,10 

2,91 

2,52 

2,31 

2,17 

2,08 

2,01 

1,96 

1,92 

1,88 

1,86 

1,84 

1,81 


0,05 

4,23 

3,37 

2,98 

2,74 

2,59 

2,47 

2,39 

2,32 

2,27 

2,22 

2,18 

2,15 

26 


0,01 

7,72 

5,53 

4,64 

4,14 

3,82 

3,59 

3,42 

3,29 

3,18 

3,09 

3,02 

2,96 


0,25 

1,38 

1,46 

1,45 

1,43 

1,41 

1,40 

1,39 

1,38 

1,37 

1,36 

1,35 

1,34 


0,10 

2,89 

2,50 

2,29 

2,16 

2,06 

2,00 

1,94 

1,90 

1,87 

1,84 

1,81 

1,79 


0,05 

4,20 

3,34 

2,95 

2,71 

2,56 

2,45 

2,36 

2,29 

2,24 

2,19 

2,15 

2,12 

28 


0,01 

7,64 

5,45 

4,57 

4,07 

3,75 

3,53 

3,36 

3,23 

3,12 

3,03 

2,96 

2,90 


0,25 

1,38 

1,45 

1,44 

1,42 

1,41 

1,39 

1,38 

1,37 

1,36 

1,35 

1,35 

1,34 


0,10 

2,88 

2,49 

2,28 

2,14 

2,05 

1,98 

1,93 

1,88 

1,85 

1,82 

1,79 

1,77 


0,05 

4,17 

3,32 

2,92 

2,69 

2,53 

2,42 

2,33 

2,27 

2,21 

2,16 

2,13 

2,09 

30 


0,01 

7,56 

5,39 

4,51 

4,02 

3,70 

3,47 

3,30 

3,17 

3,07 

2,98 

2,91 

2,84 


0,25 

1,36 

1,44 

1,42 

1,40 

1,39 

1,37 

1,36 

1,35 

1,34 

1,33 

1,32 

1,31 


0,10 

2,84 

2,44 

2,23 

2,09 

2,00 

1,93 

1,87 

1,83 

1,79 

1,76 

1,73 

1,71 


0,05 

4,08 

3,23 

2,84 

2,61 

2,45 

2,34 

2,25 

2,18 

2,12 

2,08 

2,04 

2,00 

40 


0,01 

7,31 

5,18 

4,31 

3,83 

3,51 

3,29 

3,12 

2,99 

2,89 

2,80 

2,73 

2,66 


0,25 

1,35 

1,42 

1,41 

1,38 

1,37 

1,35 

1,33 

1,32 

1,31 

1,30 

1,29 

1,29 


0,10 

2,79 

2,39 

2,18 

2,04 

1,95 

1,87 

1,82 

1,77 

1,74 

1,71 

1,68 

1,66 


0,05 

4,00 

3,15 

2,76 

2,53 

2,37 

2,25 

2,17 

2,10 

2,04 

1,99 

1,95 

1,92 

60 




0,01 

7,08 

4,98 

4,13 

3,65 

3,34 

3,12 

2,95 

2,82 

2,72 

2,63 

2,56 

2,50 


0,25 

1,34 

1,40 

1,39 

1,37 

1,35 

1,33 

1,31 

1,30 

1,29 

1,28 

1,27 

1,26 


0,10 

2,75 

2,35 

2,13 

1,99 

1,90 

1,82 

1,77 

1,72 

1,68 

1,65 

1,62 

1,60 


0,05 

3,92 

3,07 

2,68 

2,45 

2,29 

2,17 

2,09 

2,02 

1,96 

1,91 

1,87 

1,83 

120 






0,01 

6,85 

4,79 

3,95 

3,48 

3,17 

2,96 

2,79 

2,66 

2,56 

2,47 

2,40 

2,34 


0,25 

1,33 

1,39 

1,38 

1,36 

1,34 

1,32 

1,31 

1,29 

1,28 

1,27 

1,26 

1,25 


0,10 

2,73 

2,33 

2,11 

1,97 

1,88 

1,80 

1,75 

1,70 

1,66 

1,63 

1,60 

1,57 


0,05 

3,89 

3,04 

2,65 

2,42 

2,26 

2,14 

2,06 

1,98 

1,93 

1,88 

1,84 

1,80 

200 





0,01 

6,76 

4,71 

3,88 

3,41 

3,11 

2,89 

2,73 

2,60 

2,50 

2,41 

2,34 

2,27 


0,25 

1,32 

1,39 

1,37 

1,35 

1,33 

1,31 

1,29 

1,28 

1,27 

1,25 

1,24 

1,24 


0,10 

2,71 

2,30 

2,08 

1,94 

1,85 

1,77 

1,72 

1,67 

1,63 

1,60 

1,57 

1,55 

00 

0,05 

3,84 

3,00 

2,60 

2,37 

2,21 

2,10 

2,01 

1,94 

1,88 

1,83 

1,79 

1,75 


0,01 

6,63 

4,61 

3,78 

3,32 

3,02 

2,80 

2,64 

2,51 

2,41 

2,32 

2,25 

2,18 


(Continua) 
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gl para numerador N 1 






gl para 

15 

20 

24 

30 

40 

50 

60 

100 

120 

200 

500 

00 

Pr 

denomi- 
nador N 2 

1,36 

1,34 

1,33 

1,32 

1,31 

1,31 

1,30 

1,30 

1,30 

1,29 

1,29 

1,28 

0,25 


1,81 

1,76 

1,73 

1,70 

1,67 

1,65 

1,64 

1,61 

1,60 

1,59 

1,58 

1,57 

0,10 

22 

2,15 

2,07 

2,03 

1,98 

1,94 

1,91 

1,89 

1,85 

1,84 

1,82 

1,80 

1,78 

0,05 


2,98 

2,83 

2,75 

2,67 

2,58 

2,53 

2,50 

2,42 

2,40 

2,36 

2,33 

2,31 

0,01 


1,35 

1,33 

1,32 

1,31 

1,30 

1,29 

1,29 

1,28 

1,28 

1,27 

1,27 

1,26 

0,25 


1,78 

1,73 

1,70 

1,67 

1,64 

1,62 

1,61 

1,58 

1,57 

1,56 

1,54 

1,53 

0,10 

24 

2,11 

2,03 

1,98 

1,94 

1,89 

1,86 

1,84 

1,80 

1,79 

1,77 

1,75 

1,73 

0,05 


2,89 

2,74 

2,66 

2,58 

2,49 

2,44 

2,40 

2,33 

2,31 

2,27 

2,24 

2,21 

0,01 


1,34 

1,32 

1,31 

1,30 

1,29 

1,28 

1,28 

1,26 

1,26 

1,26 

1,25 

1,25 

0,25 


1,76 

1,71 

1,68 

1,65 

1,61 

1,59 

1,58 

1,55 

1,54 

1,53 

1,51 

1,50 

0,10 

26 

2,07 

1,99 

1,95 

1,90 

1,85 

1,82 

1,80 

1,76 

1,75 

1,73 

1,71 

1,69 

0,05 


2,81 

2,66 

2,58 

2,50 

2,42 

2,36 

2,33 

2,25 

2,23 

2,19 

2,16 

2,13 

0,01 


1,33 

1,31 

1,30 

1,29 

1,28 

1,27 

1,27 

1,26 

1,25 

1,25 

1,24 

1,24 

0,25 


1,74 

1,69 

1,66 

1,63 

1,59 

1,57 

1,56 

1,53 

1,52 

1,50 

1,49 

1,48 

0,10 

28 

2,04 

1,96 

1,91 

1,87 

1,82 

1,79 

1,77 

1,73 

1,71 

1,69 

1,67 

1,65 

0,05 


2,75 

2,60 

2,52 

2,44 

2,35 

2,30 

2,26 

2,19 

2,17 

2,13 

2,09 

2,06 

0,01 


1,32 

1,30 

1,29 

1,28 

1,27 

1,26 

1,26 

1,25 

1,24 

1,24 

1,23 

1,23 

0,25 


1,72 

1,67 

1,64 

1,61 

1,57 

1,55 

1,54 

1,51 

1,50 

1,48 

1,47 

1,46 

0,10 

30 

2,01 

1,93 

1,89 

1,84 

1,79 

1,76 

1,74 

1,70 

1,68 

1,66 

1,64 

1,62 

0,05 


2,70 

2,55 

2,47 

2,39 

2,30 

2,25 

2,21 

2,13 

2,11 

2,07 

2,03 

2,01 

0,01 


1,30 

1,28 

1,26 

1,25 

1,24 

1,23 

1,22 

1,21 

1,21 

1,20 

1,19 

1,19 

0,25 


1,66 

1,61 

1,57 

1,54 

1,51 

1,48 

1,47 

1,43 

1,42 

1,41 

1,39 

1,38 

0,10 

40 

1,92 

1,84 

1,79 

1,74 

1,69 

1,66 

1,64 

1,59 

1,58 

1,55 

1,53 

1,51 

0,05 


2,52 

2,37 

2,29 

2,20 

2,11 

2,06 

2,02 

1,94 

1,92 

1,87 

1,83 

1,80 

0,01 


1,27 

1,25 

1,24 

1,22 

1,21 

1,20 

1,19 

1,17 

1,17 

1,16 

1,15 

1,15 

0,25 


1,60 

1,54 

1,51 

1,48 

1,44 

1,41 

1,40 

1,36 

1,35 

1,33 

1,31 

1,29 

0,10 

60 

1,84 

1,75 

1,70 

1,65 

1,59 

1,56 

1,53 

1,48 

1,47 

1,44 

1,41 

1,39 

0,05 


2,35 

2,20 

2,12 

2,03 

1,94 

1,88 

1,84 

1,75 

1,73 

1,68 

1,63 

1,60 

0,01 


1,24 

1,22 

1,21 

1,19 

1,18 

1,17 

1,16 

1,14 

1,13 

1,12 

1,11 

1,10 

0,25 


1,55 

1,48 

1,45 

1,41 

1,37 

1,34 

1,32 

1,27 

1,26 

1,24 

1,21 

1,19 

0,10 

120 

1,75 

1,66 

1,61 

1,55 

1,50 

1,46 

1,43 

1,37 

1,35 

1,32 

1,28 

1,25 

0,05 


2,19 

2,03 

1,95 

1,86 

1,76 

1,70 

1,66 

1,56 

1,53 

1,48 

1,42 

1,38 

0,01 


1,23 

1,21 

1,20 

1,18 

1,16 

1,14 

1,12 

1,11 

1,10 

1,09 

1,08 

1,06 

0,25 


1,52 

1,46 

1,42 

1,38 

1,34 

1,31 

1,28 

1,24 

1,22 

1,20 

1,17 

1,14 

0,10 

200 

1,72 

1,62 

1,57 

1,52 

1,46 

1,41 

1,39 

1,32 

1,29 

1,26 

1,22 

1,19 

0,05 


2,13 

1,97 

1,89 

1,79 

1,69 

1,63 

1,58 

1,48 

1,44 

1,39 

1,33 

1,28 

0,01 


1,22 

1,19 

1,18 

1,16 

1,14 

1,13 

1,12 

1,09 

1,08 

1,07 

1,04 

1,00 

0,25 


1,49 

1,42 

1,38 

1,34 

1,30 

1,26 

1,24 

1,18 

1,17 

1,13 

1,08 

1,00 

0,10 


1,67 

1,57 

1,52 

1,46 

1,39 

1,35 

1,32 

1,24 

1,22 

1,17 

1,11 

1,00 

0,05 


2,04 

1,88 

1,79 

1,70 

1,59 

1,52 

1,47 

1,36 

1,32 

1,25 

1,15 

1,00 

0,01 
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TABELA D .4 

Pontos percentuais 
superiores da 
distribuigao x 2 


Exemplo 

Pr ( x 2 > 10 , 85 ) = 0,95 
Prc ( x 2 > 23 , 83 ) = 0,25 
Pr ( x 2 > 31 , 41 ) = 0,05 


para gl = 20 


Area de 25% 


Area de 95% 



Area de 5% 





0 10,85 

23,83 31,41 


Graus^^Pr 
de liberdade^^ 

0,995 

0,990 

0,975 

0,950 

0,900 

1 

392704 x 1 0 10 

157088 x 10- 9 

982069 x 10- 9 

393214 x 10- 8 

0,0157908 

2 

0,0100251 

0,0201007 

0,0506356 

0,102587 

0,210720 

3 

0,0717212 

0,114832 

0,215795 

0,351846 

0,584375 

4 

0,206990 

0 , 297110 

0,484419 

0,710721 

1,063623 

5 

0,411 740 

0,554300 

0,831211 

1,145476 

1,61031 

6 

0,675727 

0,872085 

1,237347 

1,63539 

2,2041 3 

7 

0,989265 

1,239043 

1,68987 

2,16735 

2,83311 

8 

1,344419 

1,646482 

2,17973 

2,73264 

3,48954 

9 

1,734926 

2,087912 

2,70039 

3,32511 

4,16816 

10 

2,15585 

2,55821 

3,24697 

3,94030 

4,86518 

11 

2,60321 

3,05347 

3,81575 

4,57481 

5,57779 

12 

3,07382 

3,57056 

4,40379 

5,22603 

6,30380 

13 

3,56503 

4,10691 

5,00874 

5,89186 

7,04150 

14 

4,07468 

4,66043 

5,62872 

6,57063 

7,78953 

15 

4,60094 

5,22935 

6,26214 

7,26094 

8,54675 

16 

5,14224 

5,81221 

6,90766 

7,96164 

9,31223 

17 

5,69724 

6,40776 

7,56418 

8,67176 

10,0852 

18 

6,26481 

7,01491 

8,23075 

9,39046 

10,8649 

19 

6,84398 

7,63273 

8,90655 

10,1170 

11,6509 

20 

7,43386 

8,26040 

9,59083 

10,8508 

12,4426 

21 

8,03366 

8,89720 

10,28293 

11,5913 

13,2396 

22 

8,64272 

9,54249 

10,9823 

12,3380 

14,0415 

23 

9,26042 

10,19567 

11,6885 

13,0905 

14,8479 

24 

9,88623 

10,8564 

12,4011 

13,8484 

15,6587 

25 

10,5197 

11,5240 

13,1197 

14,6114 

16,4734 

26 

11,1603 

12,1981 

13,8439 

15,3791 

17,2919 

27 

11,8076 

12,8786 

14,5733 

16,1513 

18,1138 

28 

12,4613 

1 3,5648 

15,3079 

16,9279 

18,9392 

29 

13,1211 

14,2565 

16,0471 

17,7083 

19,7677 

30 

13,7867 

14,9535 

16,7908 

18,4926 

20,5992 

40 

20,7065 

22,1643 

24,4331 

26,5093 

29,0505 

50 

27,9907 

29,7067 

32,3574 

34,7642 

37,6886 

60 

35,5346 

37,4848 

40,481 7 

43,1879 

46,4589 

70 

43,2752 

45,4418 

48,7576 

51,7393 

55,3290 

80 

51,1720 

53,5400 

57,1532 

60,3915 

64,2778 

90 

59,1963 

61,7541 

65,6466 

69,1260 

73,2912 

100* 

67,3276 

70,0648 

74,2219 

77,9295 

82,3581 


*Para gl maior que 100, 
liberdade. 


i expressao ^2x 2 — ^(2k— 1) = Z segue a distribui^ao normal padronizada, em que k representa os graus de 

( Continua ) 
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0,750 

0,500 

0,250 

0,100 

0,050 

0,025 

0,010 

0,005 

0,1015308 

0,454937 

1,32330 

2,70554 

3,84146 

5,02389 

6,63490 

7,87944 

0,575364 

1,38629 

2,77259 

4,60517 

5,99147 

7,37776 

9,21034 

10,5966 

1,212534 

2,36597 

4,10835 

6,25139 

7,81473 

9,34840 

11,3449 

12,8381 

1,92255 

3,35670 

5,38527 

7,77944 

9,48773 

11,1433 

13,2767 

14,8602 

2,67460 

4,35146 

6,62568 

9,23635 

11,0705 

12,8325 

15,0863 

16,7496 

3,45460 

5,34812 

7,84080 

10,6446 

12,5916 

14,4494 

16,8119 

18,5476 

4,25485 

6,34581 

9,03715 

12,0170 

14,0671 

16,0128 

18,4753 

20,2777 

5,07064 

7,34412 

10,2188 

13,3616 

15,5073 

17,5346 

20,0902 

21,9550 

5,89883 

8,34283 

11,3887 

14,6837 

16,9190 

19,0228 

21,6660 

23,5893 

6,73720 

9,34182 

12,5489 

15,9871 

18,3070 

20,4831 

23,2093 

25,1882 

7,58412 

10,3410 

13,7007 

17,2750 

19,6751 

21,9200 

24,7250 

26,7569 

8,43842 

11,3403 

14,8454 

1 8,5494 

21,0261 

23,3367 

26,2170 

28,2995 

9,29906 

12,3398 

15,9839 

19,8119 

22,3621 

24,7356 

27,6883 

29,8194 

10,1653 

13,3393 

1 7,11 70 

21,0642 

23,6848 

26,1190 

29,1413 

31,3193 

11,0365 

14,3389 

18,2451 

22,3072 

24,9958 

27,4884 

30,5779 

32,8013 

11,9122 

15,3385 

19,3688 

23,5418 

26,2962 

28,8454 

31,9999 

34,2672 

12,7919 

16,3381 

20,4887 

24,7690 

27,5871 

30,1910 

33,4087 

35,7185 

13,6753 

17,3379 

21,6049 

25,9894 

28,8693 

31,5264 

34,8053 

37,1564 

14,5620 

18,3376 

22,7178 

27,2036 

30,1435 

32,8523 

36,1908 

38,5822 

15,4518 

19,3374 

23,8277 

28,4120 

31,4104 

34,1696 

37,5662 

39,9968 

16,3444 

20,3372 

24,9348 

29,6151 

32,6705 

35,4789 

38,9321 

41,4010 

17,2396 

21,3370 

26,0393 

30,8133 

33,9244 

36,7807 

40,2894 

42,7956 

18,1373 

22,3369 

27,1413 

32,0069 

35,1725 

38,0757 

41,6384 

44,1813 

19,0372 

23,3367 

28,2412 

33,1963 

36,4151 

39,3641 

42,9798 

45,5585 

19,9393 

24,3366 

29,3389 

34,3816 

37,6525 

40,6465 

44,3141 

46,9278 

20,8434 

25,3364 

30,4345 

35,5631 

38,8852 

41,9232 

45,6417 

48,2899 

21,7494 

26,3363 

31,5284 

36,7412 

40,1133 

43,1944 

46,9630 

49,6449 

22,6572 

27,3363 

32,6205 

37,9159 

41,3372 

44,4607 

48,2782 

50,9933 

23,5666 

28,3362 

33,7109 

39,0875 

42,5569 

45,7222 

49,5879 

52,3356 

24,4776 

29,3360 

34,7998 

40,2560 

43,7729 

46,9792 

50,8922 

53,6720 

33,6603 

39,3354 

45,6160 

51,8050 

55,7585 

59,3417 

63,6907 

66,7659 

42,9421 

49,3349 

56,3336 

63,1671 

67,5048 

71,4202 

76,1539 

79,4900 

52,2938 

59,3347 

66,9814 

74,3970 

79,0819 

83,2976 

88,3794 

91,9517 

61,6983 

69,3344 

77,5766 

85,5271 

90,5312 

95,0231 

100,425 

104,215 

71,1445 

79,3343 

88,1303 

96,5782 

101,879 

106,629 

112,329 

116,321 

80,6247 

89,3342 

98,6499 

107,565 

113,145 

118,136 

124,116 

128,299 

90,1332 

99,3341 

109,141 

118,498 

124,342 

129,561 

135,807 

140,169 


Fonte: resumida de PEARSON, E. S.; HARTLEY, H. O. (Eds.). Biometrika tables for statisticians. 3. ed. Nova York: Cambridge University Press, 1966. v. 1, tabela 12. 
Reprodugao autorizada pelos editores e curadores da Biometrika. 
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TABELA D . 5 A Estatfstica d de Durbin-Watson: pontos de significancia de d L e d v em niveis de significancia de 0,05 



k' = 

: 1 

k' = 

-2 

k' = 

= 3 

k = 

= 4 

k = 

= 5 

k' - 

= 6 

k'-- 

= 7 

k'-- 

= 8 

k'-- 

= 9 

k = 

= 10 

n 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

6 

7 

0,610 

0,700 

1,400 

1,356 

0,467 

1,896 

~ 

~ 

~ 

~ 

~ 

~ 

~ 

— 

— 

~ 

~ 

~ 

— 

~ 

— 

~ 

8 

0,763 

1,332 

0,559 

1,777 

0,368 

2,287 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

9 

0,824 

1,320 

0,629 

1,699 

0,455 

2,128 

0,296 

2,588 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

10 

0,879 

1,320 

0,697 

1,641 

0,525 

2,016 

0,376 

2,414 

0,243 

2,822 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

11 

0,927 

1,324 

0,658 

1,604 

0,595 

1,928 

0,444 

2,283 

0,316 

2,645 

0,203 

3,005 

— 

- 

- 

- 

- 

- 

- 

- 

12 

0,971 

1,331 

0,812 

1,579 

0,658 

1,864 

0,512 

2,177 

0,379 

2,506 

0,268 

2,832 

0,171 

3,149 

- 

- 

- 

- 

- 

- 

13 

1,010 

1,340 

0,861 

1,562 

0,715 

1,816 

0,574 

2,094 

0,445 

2,390 

0,328 

2,692 

0,230 

2,985 

0,147 

3,266 

- 

- 

- 

- 

14 

1,045 

1,350 

0,905 

1,551 

0,767 

1,779 

0,632 

2,030 

0,505 

2,296 

0,389 

2,572 

0,286 

2,848 

0,200 

3,111 

0,127 

3,360 

- 

- 

15 

1,077 

1,361 

0,946 

1,543 

0,814 

1,750 

0,685 

1,977 

0,562 

2,220 

0,447 

2,472 

0,343 

2,727 

0,251 

2,979 

0,175 

3,216 

0,111 

3,438 

16 

1,106 

1,371 

0,982 

1,539 

0,857 

1,728 

0,734 

1,935 

0,615 

2,157 

0,502 

2,388 

0,398 

2,624 

0,304 

2,860 

0,222 

3,090 

0,155 

3,304 

17 

1,133 

1,381 

1,015 

1,536 

0,897 

1,710 

0,779 

1,900 

0,664 

2,104 

0,554 

2,318 

0,451 

2,537 

0,356 

2,757 

0,272 

2,975 

0,198 

3,184 

18 

1,158 

1,391 

1,046 

1,535 

0,933 

1,696 

0,820 

1,872 

0,710 

2,060 

0,603 

2,257 

0,502 

2,461 

0,407 

2,667 

0,321 

2,873 

0,244 

3,073 

19 

1,180 

1,401 

1,074 

1,536 

0,967 

1,685 

0,859 

1,848 

0,752 

2,023 

0,649 

2,206 

0,549 

2,396 

0,456 

2,589 

0,369 

2,783 

0,290 

2,974 

20 

1,201 

1,411 

1,100 

1,537 

0,998 

1,676 

0,894 

1,828 

0,792 

1,991 

0,692 

2,162 

0,595 

2,339 

0,502 

2,521 

0,416 

2,704 

0,336 

2,885 

21 

1,221 

1,420 

1,125 

1,538 

1,026 

1,669 

0,927 

1,812 

0,829 

1,964 

0,732 

2,124 

0,637 

2,290 

0,547 

2,460 

0,461 

2,633 

0,380 

2,806 

22 

1,239 

1,429 

1,147 

1,541 

1,053 

1,664 

0,958 

1,797 

0,863 

1,940 

0,769 

2,090 

0,677 

2,246 

0,588 

2,407 

0,504 

2,571 

0,424 

2,734 

23 

1,257 

1,437 

1,168 

1,543 

1,078 

1,660 

0,986 

1,785 

0,895 

1,920 

0,804 

2,061 

0,715 

2,208 

0,628 

2,360 

0,545 

2,514 

0,465 

2,670 

24 

1,273 

1,446 

1,188 

1,546 

1,101 

1,656 

1,013 

1,775 

0,925 

1,902 

0,837 

2,035 

0,751 

2,174 

0,666 

2,318 

0,584 

2,464 

0,506 

2,613 

25 

1,288 

1,454 

1,206 

1,550 

1,123 

1,654 

1,038 

1,767 

0,953 

1,886 

0,868 

2,012 

0,784 

2,144 

0,702 

2,280 

0,621 

2,419 

0,544 

2,560 

26 

1,302 

1,461 

1,224 

1,553 

1,143 

1,652 

1,062 

1,759 

0,979 

1,873 

0,897 

1,992 

0,816 

2,117 

0,735 

2,246 

0,657 

2,379 

0,581 

2,513 

27 

1,316 

1,469 

1,240 

1,556 

1,162 

1,651 

1,084 

1,753 

1,004 

1,861 

0,925 

1,974 

0,845 

2,093 

0,767 

2,216 

0,691 

2,342 

0,616 

2,470 

28 

1,328 

1,476 

1,255 

1,560 

1,181 

1,650 

1,104 

1,747 

1,028 

1,850 

0,951 

1,958 

0,874 

2,071 

0,798 

2,188 

0,723 

2,309 

0,650 

2,431 

29 

1,341 

1,483 

1,270 

1,563 

1,198 

1,650 

1,124 

1,743 

1,050 

1,841 

0,975 

1,944 

0,900 

2,052 

0,826 

2,164 

0,753 

2,278 

0,682 

2,396 

30 

1,352 

1,489 

1,284 

1,567 

1,214 

1,650 

1,143 

1,739 

1,071 

1,833 

0,998 

1,931 

0,926 

2,034 

0,854 

2,141 

0,782 

2,251 

0,712 

2,363 

31 

1,363 

1,496 

1,297 

1,570 

1,229 

1,650 

1,160 

1,735 

1,090 

1,825 

1,020 

1,920 

0,950 

2,018 

0,879 

2,120 

0,810 

2,226 

0,741 

2,333 

32 

1,373 

1,502 

1,309 

1,574 

1,244 

1,650 

1,177 

1,732 

1,109 

1,819 

1,041 

1,909 

0,972 

2,004 

0,904 

2,102 

0,836 

2,203 

0,769 

2,306 

33 

1,383 

1,508 

1,321 

1,577 

1,258 

1,651 

1,193 

1,730 

1,127 

1,813 

1,061 

1,900 

0,994 

1,991 

0,927 

2,085 

0,861 

2,181 

0,795 

2,281 

34 

1,393 

1,514 

1,333 

1,580 

1,271 

1,652 

1,208 

1,728 

1,144 

1,808 

1,080 

1,891 

1,015 

1,979 

0,950 

2,069 

0,885 

2,162 

0,821 

2,257 

35 

1,402 

1,519 

1,343 

1,584 

1,283 

1,653 

1,222 

1,726 

1,160 

1,803 

1,097 

1,884 

1,034 

1,967 

0,971 

2,054 

0,908 

2,144 

0,845 

2,236 

36 

1,411 

1,525 

1,354 

1,587 

1,295 

1,654 

1,236 

1,724 

1,175 

1,799 

1,114 

1,877 

1,053 

1,957 

0,991 

2,041 

0,930 

2,127 

0,868 

2,216 

37 

1,419 

1,530 

1,364 

1,590 

1,307 

1,655 

1,249 

1,723 

1,190 

1,795 

1,131 

1,870 

1,071 

1,948 

1,011 

2,029 

0,951 

2,112 

0,891 

2,198 

38 

1,427 

1,535 

1,373 

1,594 

1,318 

1,656 

1,261 

1,722 

1,204 

1,792 

1,146 

1,864 

1,088 

1,939 

1,029 

2,017 

0,970 

2,098 

0,912 

2,180 

39 

1,435 

1,540 

1,382 

1,597 

1,328 

1,658 

1,273 

1,722 

1,218 

1,789 

1,161 

1,859 

1,104 

1,932 

1,047 

2,007 

0,990 

2,085 

0,932 

2,164 

40 

1,442 

1,544 

1,391 

1,600 

1,338 

1,659 

1,285 

1,721 

1,230 

1,786 

1,175 

1,854 

1,120 

1,924 

1,064 

1,997 

1,008 

2,072 

0,952 

2,149 

45 

1,475 

1,566 

1,430 

1,615 

1,383 

1,666 

1,336 

1,720 

1,287 

1,776 

1,238 

1,835 

1,189 

1,895 

1,139 

1,958 

1,089 

2,022 

1,038 

2,088 

50 

1,503 

1,585 

1,462 

1,628 

1,421 

1,674 

1,378 

1,721 

1,335 

1,771 

1,291 

1,822 

1,246 

1,875 

1,201 

1,930 

1,156 

1,986 

1,110 

2,044 

55 

1,528 

1,601 

1,490 

1,641 

1,452 

1,681 

1,414 

1,724 

1,374 

1,768 

1,334 

1,814 

1,294 

1,861 

1,253 

1,909 

1,212 

1,959 

1,170 

2,010 

60 

1,549 

1,616 

1,514 

1,652 

1,480 

1,689 

1,444 

1,727 

1,408 

1,767 

1,372 

1,808 

1,335 

1,850 

1,298 

1,894 

1,260 

1,939 

1,222 

1,984 

65 

1,567 

1,629 

1,536 

1,662 

1,503 

1,696 

1,471 

1,731 

1,438 

1,767 

1,404 

1,805 

1,370 

1,843 

1,336 

1,882 

1,301 

1,923 

1,266 

1,964 

70 

1,583 

1,641 

1,554 

1,672 

1,525 

1,703 

1,494 

1,735 

1,464 

1,768 

1,433 

1,802 

1,401 

1,837 

1,369 

1,873 

1,337 

1,910 

1,305 

1,948 

75 

1,598 

1,652 

1,571 

1,680 

1,543 

1,709 

1,515 

1,739 

1,487 

1,770 

1,458 

1,801 

1,428 

1,834 

1,399 

1,867 

1,369 

1,901 

1,339 

1,935 

80 

1,611 

1,662 

1,586 

1,688 

1,560 

1,715 

1,534 

1,743 

1,507 

1,772 

1,480 

1,801 

1,453 

1,831 

1,425 

1,861 

1,397 

1,893 

1,369 

1,925 

85 

1,624 

1,671 

1,600 

1,696 

1,575 

1,721 

1,550 

1,747 

1,525 

1,774 

1,500 

1,801 

1,474 

1,829 

1,448 

1,857 

1,422 

1,886 

1,396 

1,916 

90 

1,635 

1,679 

1,612 

1,703 

1,589 

1,726 

1,566 

1,751 

1,542 

1,776 

1,518 

1,801 

1,494 

1,827 

1,469 

1,854 

1,445 

1,881 

1,420 

1,909 

95 

1,645 

1,687 

1,623 

1,709 

1,602 

1,732 

1,579 

1,755 

1,557 

1,778 

1,535 

1,802 

1,512 

1,827 

1,489 

1,852 

1,465 

1,877 

1,442 

1,903 

100 

1,654 

1,694 

1,634 

1,715 

1,613 

1,736 

1,592 

1,758 

1,571 

1,780 

1,550 

1,803 

1,528 

1,826 

1,506 

1,850 

1,484 

1,874 

1,462 

1,898 

150 

1,720 

1,746 

1,706 

1,760 

1,693 

1,774 

1,679 

1,788 

1,665 

1,802 

1,651 

1,817 

1,637 

1,832 

1,622 

1,847 

1,608 

1,862 

1,594 

1,877 

200 

1,758 

1,778 

1,748 

1,789 

1,738 

1,799 

1,728 

1,810 

1,718 

1,820 

1,707 

1,831 

1,697 

1,841 

1,686 

1,852 

1,675 

1,863 

1,665 

1,874 


(Continua) 
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TABELA D.5A Estatfstica d de Durbin-Watson: pontos de significancia de d L e d v em niveis de significancia de 0,05 (Continuagao) 


n 

k' = 

11 

k' = 

12 

k’ 

= 13 

k' = 

14 

k' = 

: 15 

k' = 

: 16 

k' = 

: 17 

k' = 

: 18 

k' = 

19 

k’ = 

20 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

16 

0,098 

3,503 



















17 

0,138 

3,378 

0,087 

3,557 

















18 

0,177 

3,265 

0,123 

3,441 

0,078 

3,603 















19 

0,220 

3,159 

0,160 

3,335 

0,111 

3,496 

0,070 

3,642 













20 

0,263 

3,063 

0,200 

3,234 

0,145 

3,395 

0,100 

3,542 

0,063 

3,676 











21 

0,307 

2,976 

0,240 

3,141 

0,182 

3,300 

0,132 

3,448 

0,091 

3,583 

0,058 

3,705 

- 

- 

- 

- 

- 

- 

- 

- 

22 

0,349 

2,897 

0,281 

3,057 

0,220 

3,211 

0,166 

3,358 

0,120 

3,495 

0,083 

3,619 

0,052 

3,731 

- 

- 

- 

- 

- 

- 

23 

0,391 

2,826 

0,322 

2,979 

0,259 

3,128 

0,202 

3,272 

0,153 

3,409 

0,110 

3,535 

0,076 

3,650 

0,048 

3,753 

- 

- 

- 

- 

24 

0,431 

2,761 

0,362 

2,908 

0,297 

3,053 

0,239 

3,193 

0,186 

3,327 

0,141 

3,454 

0,101 

3,572 

0,070 

3,678 

0,044 

3,773 

- 

- 

25 

0,470 

2,702 

0,400 

2,844 

0,335 

2,983 

0,275 

3,119 

0,221 

3,251 

0,172 

3,376 

0,130 

3,494 

0,094 

3,604 

0,065 

3,702 

0,041 

3,790 

26 

0,508 

2,649 

0,438 

2,784 

0,373 

2,919 

0,312 

3,051 

0,256 

3,179 

0,205 

3,303 

0,160 

3,420 

0,120 

3,531 

0,087 

3,632 

0,060 

3,724 

27 

0,544 

2,600 

0,475 

2,730 

0,409 

2,859 

0,348 

2,987 

0,291 

3,112 

0,238 

3,233 

0,191 

3,349 

0,149 

3,460 

0,112 

3,563 

0,081 

3,658 

28 

0,578 

2,555 

0,510 

2,680 

0,445 

2,805 

0,383 

2,928 

0,325 

3,050 

0,271 

3,168 

0,222 

3,283 

0,178 

3,392 

0,138 

3,495 

0,104 

3,592 

29 

0,612 

2,515 

0,544 

2,634 

0,479 

2,755 

0,418 

2,874 

0,359 

2,992 

0,305 

3,107 

0,254 

3,219 

0,208 

3,327 

0,166 

3,431 

0,129 

3,528 

30 

0,643 

2,477 

0,577 

2,592 

0,512 

2,708 

0,451 

2,823 

0,392 

2,937 

0,337 

3,050 

0,286 

3,160 

0,238 

3,266 

0,195 

3,368 

0,156 

3,465 

31 

0,674 

2,443 

0,608 

2,553 

0,545 

2,665 

0,484 

2,776 

0,425 

2,887 

0,370 

2,996 

0,317 

3,103 

0,269 

3,208 

0,224 

3,309 

0,183 

3,406 

32 

0,703 

2,411 

0,638 

2,517 

0,576 

2,625 

0,515 

2,733 

0,457 

2,840 

0,401 

2,946 

0,349 

3,050 

0,299 

3,153 

0,253 

3,252 

0,211 

3,348 

33 

0,731 

2,382 

0,668 

2,484 

0,606 

2,588 

0,546 

2,692 

0,488 

2,796 

0,432 

2,899 

0,379 

3,000 

0,329 

3,100 

0,283 

3,198 

0,239 

3,293 

34 

0,758 

2,355 

0,695 

2,454 

0,634 

2,554 

0,575 

2,654 

0,518 

2,754 

0,462 

2,854 

0,409 

2,954 

0,359 

3,051 

0,312 

3,147 

0,267 

3,240 

35 

0,783 

2,330 

0,722 

2,425 

0,662 

2,521 

0,604 

2,619 

0,547 

2,716 

0,492 

2,813 

0,439 

2,910 

0,388 

3,005 

0,340 

3,099 

0,295 

3,190 

36 

0,808 

2,306 

0,748 

2,398 

0,689 

2,492 

0,631 

2,586 

0,575 

2,680 

0,520 

2,774 

0,467 

2,868 

0,417 

2,961 

0,369 

3,053 

0,323 

3,142 

37 

0,831 

2,285 

0,772 

2,374 

0,714 

2,464 

0,657 

2,555 

0,602 

2,646 

0,548 

2,738 

0,495 

2,829 

0,445 

2,920 

0,397 

3,009 

0,351 

3,097 

38 

0,854 

2,265 

0,796 

2,351 

0,739 

2,438 

0,683 

2,526 

0,628 

2,614 

0,575 

2,703 

0,522 

2,792 

0,472 

2,880 

0,424 

2,968 

0,378 

3,054 

39 

0,875 

2,246 

0,819 

2,329 

0,763 

2,413 

0,707 

2,499 

0,653 

2,585 

0,600 

2,671 

0,549 

2,757 

0,499 

2,843 

0,451 

2,929 

0,404 

3,013 

40 

0,896 

2,228 

0,840 

2,309 

0,785 

2,391 

0,731 

2,473 

0,678 

2,557 

0,626 

2,641 

0,575 

2,724 

0,525 

2,808 

0,477 

2,892 

0,430 

2,974 

45 

0,988 

2,156 

0,938 

2,225 

0,887 

2,296 

0,838 

2,367 

0,788 

2,439 

0,740 

2,512 

0,692 

2,586 

0,644 

2,659 

0,598 

2,733 

0,553 

2,807 

50 

1,064 

2,103 

1,019 

2,163 

0,973 

2,225 

0,927 

2,287 

0,882 

2,350 

0,836 

2,414 

0,792 

2,479 

0,747 

2,544 

0,703 

2,610 

0,660 

2,675 

55 

1,129 

2,062 

1,087 

2,116 

1,045 

2,170 

1,003 

2,225 

0,961 

2,281 

0,919 

2,338 

0,877 

2,396 

0,836 

2,454 

0,795 

2,512 

0,754 

2,571 

60 

1,184 

2,031 

1,145 

2,079 

1,106 

2,127 

1,068 

2,177 

1,029 

2,227 

0,990 

2,278 

0,951 

2,330 

0,913 

2,382 

0,874 

2,434 

0,836 

2,487 

65 

1,231 

2,006 

1,195 

2,049 

1,160 

2,093 

1,124 

2,138 

1,088 

2,183 

1,052 

2,229 

1,016 

2,276 

0,980 

2,323 

0,944 

2,371 

0,908 

2,419 

70 

1,272 

1,986 

1,239 

2,026 

1,206 

2,066 

1,172 

2,106 

1,139 

2,148 

1,105 

2,189 

1,072 

2,232 

1,038 

2,275 

1,005 

2,318 

0,971 

2,362 

75 

1,308 

1,970 

1,277 

2,006 

1,247 

2,043 

1,215 

2,080 

1,184 

2,118 

1,153 

2,156 

1,121 

2,195 

1,090 

2,235 

1,058 

2,275 

1,027 

2,315 

80 

1,340 

1,957 

1,311 

1,991 

1,283 

2,024 

1,253 

2,059 

1,224 

2,093 

1,195 

2,129 

1,165 

2,165 

1,136 

2,201 

1,106 

2,238 

1,076 

2,275 

85 

1,369 

1,946 

1,342 

1,977 

1,315 

2,009 

1,287 

2,040 

1,260 

2,073 

1,232 

2,105 

1,205 

2,139 

1,177 

2,172 

1,149 

2,206 

1,121 

2,241 

90 

1,395 

1,937 

1,369 

1,966 

1,344 

1,995 

1,318 

2,025 

1,292 

2,055 

1,266 

2,085 

1,240 

2,116 

1,213 

2,148 

1,187 

2,179 

1,160 

2,211 

95 

1,418 

1,929 

1,394 

1,956 

1,370 

1,984 

1,345 

2,012 

1,321 

2,040 

1,296 

2,068 

1,271 

2,097 

1,247 

2,126 

1,222 

2,156 

1,197 

2,186 

100 

1,439 

1,923 

1,416 

1,948 

1,393 

1,974 

1,371 

2,000 

1,347 

2,026 

1,324 

2,053 

1,301 

2,080 

1,277 

2,108 

1,253 

2,135 

1,229 

2,164 

150 

1,579 

1,892 

1,564 

1,908 

1,550 

1,924 

1,535 

1,940 

1,519 

1,956 

1,504 

1,972 

1,489 

1,989 

1,474 

2,006 

1,458 

2,023 

1,443 

2,040 

200 

1,654 

1,885 

1,643 

1,896 

1,632 

1,908 

1,621 

1,919 

1,610 

1,931 

1,599 

1,943 

1,588 

1,955 

1,576 

1,967 

1,565 

1,979 

1,554 

1,991 


Nota: n = numero de observa 5 oes, k'= numero de variaveis explanatorias, excluindo o termo constante. 

Fonte: Esta tabela e uma extensao da tabela original de Durbin-Watson, reproduzida de SAVIN, N. E.; WHITE, K. J. “The Durbin-Watson test for serial correlation with 
extreme small samples or many regressors.” Econometrica, v. 45, p. 1.989-1996, nov. 1977. Ela foi corrigida por FAREBROTHER, R. W. Econometrica, v. 48, p. 1.554, 
set. 1980. Reprodu^ao autorizada pela Econometric Society. 


EXEMPLO 1 Se n = 40 e k' = 4, d L = 1,285 e d u = 1,721. Se um valor calculado de d e menor que 

1,285, ha evidencia de correlafao serial positiva de primeira ordem; se e maior que 1,721, nao 
ha nenhuma evidencia de correla^ao serial positiva de primeira ordem; mas, se d esta entre o 
limite inferior e o limite superior, a evidencia e inconclusiva em relagao a presenga ou ausencia 
de correlagao serial positiva de primeira ordem. 
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TABELA D.5B Estatfstica d de Durbin-Watson: pontos de significance de d L e d v em niveis de significance de 0,01 



k' = 

= 1 

k'-- 

= 2 

k = 

3 

k 

= 4 

k = 

= 5 

k = 

= 6 

k'- 

= 7 

k - 

= 8 

k - 

= 9 

k = 

10 

n 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

di 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

6 

7 

0,390 

0,435 

1,142 

1,036 

0,294 

1,676 

~ 

~ 

~ 

— 

~ 

— 

~ 

~ 

~ 

~ 

~ 

— 

~ 

~ 

~ 

— 

8 

0,497 

1,003 

0,345 

1,489 

0,229 

2,102 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

9 

0,554 

0,998 

0,408 

1,389 

0,279 

1,875 

0,183 

2,433 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

10 

0,604 

1,001 

0,466 

1,333 

0,340 

1,733 

0,230 

2,193 

0,150 

2,690 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

11 

0,653 

1,010 

0,519 

1,297 

0,396 

1,640 

0,286 

2,030 

0,193 

2,453 

0,124 

2,892 

- 

- 

- 

- 

- 

- 

- 

- 

12 

0,697 

1,023 

0,569 

1,274 

0,449 

1,575 

0,339 

1,913 

0,244 

2,280 

0,164 

2,665 

0,105 

3,053 

- 

- 

- 

- 

- 

- 

13 

0,738 

1,038 

0,616 

1,261 

0,499 

1,526 

0,391 

1,826 

0,294 

2,150 

0,211 

2,490 

0,140 

2,838 

0,090 

3,182 

- 

- 

- 

- 

14 

0,776 

1,054 

0,660 

1,254 

0,547 

1,490 

0,441 

1,757 

0,343 

2,049 

0,257 

2,354 

0,183 

2,667 

0,122 

2,981 

0,078 

3,287 

- 

- 

15 

0,811 

1,070 

0,700 

1,252 

0,591 

1,464 

0,488 

1,704 

0,391 

1,967 

0,303 

2,244 

0,226 

2,530 

0,161 

2,817 

0,107 

3,101 

0,068 

3,374 

16 

0,844 

1,086 

0,737 

1,252 

0,633 

1,446 

0,532 

1,663 

0,437 

1,900 

0,349 

2,153 

0,269 

2,416 

0,200 

2,681 

0,142 

2,944 

0,094 

3,201 

17 

0,874 

1,102 

0,772 

1,255 

0,672 

1,432 

0,574 

1,630 

0,480 

1,847 

0,393 

2,078 

0,313 

2,319 

0,241 

2,566 

0,179 

2,811 

0,127 

3,053 

18 

0,902 

1,118 

0,805 

1,259 

0,708 

1,422 

0,613 

1,604 

0,522 

1,803 

0,435 

2,015 

0,355 

2,238 

0,282 

2,467 

0,216 

2,697 

0,160 

2,925 

19 

0,928 

1,132 

0,835 

1,265 

0,742 

1,415 

0,650 

1,584 

0,561 

1,767 

0,476 

1,963 

0,396 

2,169 

0,322 

2,381 

0,255 

2,597 

0,196 

2,813 

20 

0,952 

1,147 

0,863 

1,271 

0,773 

1,411 

0,685 

1,567 

0,598 

1,737 

0,515 

1,918 

0,436 

2,110 

0,362 

2,308 

0,294 

2,510 

0,232 

2,714 

21 

0,975 

1,161 

0,890 

1,277 

0,803 

1,408 

0,718 

1,554 

0,633 

1,712 

0,552 

1,881 

0,474 

2,059 

0,400 

2,244 

0,331 

2,434 

0,268 

2,625 

22 

0,997 

1,174 

0,914 

1,284 

0,831 

1,407 

0,748 

1,543 

0,667 

1,691 

0,587 

1,849 

0,510 

2,015 

0,437 

2,188 

0,368 

2,367 

0,304 

2,548 

23 

1,018 

1,187 

0,938 

1,291 

0,858 

1,407 

0,777 

1,534 

0,698 

1,673 

0,620 

1,821 

0,545 

1,977 

0,473 

2,140 

0,404 

2,308 

0,340 

2,479 

24 

1,037 

1,199 

0,960 

1,298 

0,882 

1,407 

0,805 

1,528 

0,728 

1,658 

0,652 

1,797 

0,578 

1,944 

0,507 

2,097 

0,439 

2,255 

0,375 

2,417 

25 

1,055 

1,211 

0,981 

1,305 

0,906 

1,409 

0,831 

1,523 

0,756 

1,645 

0,682 

1,776 

0,610 

1,915 

0,540 

2,059 

0,473 

2,209 

0,409 

2,362 

26 

1,072 

1,222 

1,001 

1,312 

0,928 

1,411 

0,855 

1,518 

0,783 

1,635 

0,711 

1,759 

0,640 

1,889 

0,572 

2,026 

0,505 

2,168 

0,441 

2,313 

27 

1,089 

1,233 

1,019 

1,319 

0,949 

1,413 

0,878 

1,515 

0,808 

1,626 

0,738 

1,743 

0,669 

1,867 

0,602 

1,997 

0,536 

2,131 

0,473 

2,269 

28 

1,104 

1,244 

1,037 

1,325 

0,969 

1,415 

0,900 

1,513 

0,832 

1,618 

0,764 

1,729 

0,696 

1,847 

0,630 

1,970 

0,566 

2,098 

0,504 

2,229 

29 

1,119 

1,254 

1,054 

1,332 

0,988 

1,418 

0,921 

1,512 

0,855 

1,611 

0,788 

1,718 

0,723 

1,830 

0,658 

1,947 

0,595 

2,068 

0,533 

2,193 

30 

1,133 

1,263 

1,070 

1,339 

1,006 

1,421 

0,941 

1,511 

0,877 

1,606 

0,812 

1,707 

0,748 

1,814 

0,684 

1,925 

0,622 

2,041 

0,562 

2,160 

31 

1,147 

1,273 

1,085 

1,345 

1,023 

1,425 

0,960 

1,510 

0,897 

1,601 

0,834 

1,698 

0,772 

1,800 

0,710 

1,906 

0,649 

2,017 

0,589 

2,131 

32 

1,160 

1,282 

1,100 

1,352 

1,040 

1,428 

0,979 

1,510 

0,917 

1,597 

0,856 

1,690 

0,794 

1,788 

0,734 

1,889 

0,674 

1,995 

0,615 

2,104 

33 

1,172 

1,291 

1,114 

1,358 

1,055 

1,432 

0,996 

1,510 

0,936 

1,594 

0,876 

1,683 

0,816 

1,776 

0,757 

1,874 

0,698 

1,975 

0,641 

2,080 

34 

1,184 

1,299 

1,128 

1,364 

1,070 

1,435 

1,012 

1,511 

0,954 

1,591 

0,896 

1,677 

0,837 

1,766 

0,779 

1,860 

0,722 

1,957 

0,665 

2,057 

35 

1,195 

1,307 

1,140 

1,370 

1,085 

1,439 

1,028 

1,512 

0,971 

1,589 

0,914 

1,671 

0,857 

1,757 

0,800 

1,847 

0,744 

1,940 

0,689 

2,037 

36 

1,206 

1,315 

1,153 

1,376 

1,098 

1,442 

1,043 

1,513 

0,988 

1,588 

0,932 

1,666 

0,877 

1,749 

0,821 

1,836 

0,766 

1,925 

0,711 

2,018 

37 

1,217 

1,323 

1,165 

1,382 

1,112 

1,446 

1,058 

1,514 

1,004 

1,586 

0,950 

1,662 

0,895 

1,742 

0,841 

1,825 

0,787 

1,911 

0,733 

2,001 

38 

1,227 

1,330 

1,176 

1,388 

1,124 

1,449 

1,072 

1,515 

1,019 

1,585 

0,966 

1,658 

0,913 

1,735 

0,860 

1,816 

0,807 

1,899 

0,754 

1,985 

39 

1,237 

1,337 

1,187 

1,393 

1,137 

1,453 

1,085 

1,517 

1,034 

1,584 

0,982 

1,655 

0,930 

1,729 

0,878 

1,807 

0,826 

1,887 

0,774 

1,970 

40 

1,246 

1,344 

1,198 

1,398 

1,148 

1,457 

1,098 

1,518 

1,048 

1,584 

0,997 

1,652 

0,946 

1,724 

0,895 

1,799 

0,844 

1,876 

0,749 

1,956 

45 

1,288 

1,376 

1,245 

1,423 

1,201 

1,474 

1,156 

1,528 

1,111 

1,584 

1,065 

1,643 

1,019 

1,704 

0,974 

1,768 

0,927 

1,834 

0,881 

1,902 

50 

1,324 

1,403 

1,285 

1,446 

1,245 

1,491 

1,205 

1,538 

1,164 

1,587 

1,123 

1,639 

1,081 

1,692 

1,039 

1,748 

0,997 

1,805 

0,955 

1,864 

55 

1,356 

1,427 

1,320 

1,466 

1,284 

1,506 

1,247 

1,548 

1,209 

1,592 

1,172 

1,638 

1,134 

1,685 

1,095 

1,734 

1,057 

1,785 

1,018 

1,837 

60 

1,383 

1,449 

1,350 

1,484 

1,317 

1,520 

1,283 

1,558 

1,249 

1,598 

1,214 

1,639 

1,179 

1,682 

1,144 

1,726 

1,108 

1,771 

1,072 

1,817 

65 

1,407 

1,468 

1,377 

1,500 

1,346 

1,534 

1,315 

1,568 

1,283 

1,604 

1,251 

1,642 

1,218 

1,680 

1,186 

1,720 

1,153 

1,761 

1,120 

1,802 

70 

1,429 

1,485 

1,400 

1,515 

1,372 

1,546 

1,343 

1,578 

1,313 

1,611 

1,283 

1,645 

1,253 

1,680 

1,223 

1,716 

1,192 

1,754 

1,162 

1,792 

75 

1,448 

1,501 

1,422 

1,529 

1,395 

1,557 

1,368 

1,587 

1,340 

1,617 

1,313 

1,649 

1,284 

1,682 

1,256 

1,714 

1,227 

1,748 

1,199 

1,783 

80 

1,466 

1,515 

1,441 

1,541 

1,416 

1,568 

1,390 

1,595 

1,364 

1,624 

1,338 

1,653 

1,312 

1,683 

1,285 

1,714 

1,259 

1,745 

1,232 

1,777 

85 

1,482 

1,528 

1,458 

1,553 

1,435 

1,578 

1,411 

1,603 

1,386 

1,630 

1,362 

1,657 

1,337 

1,685 

1,312 

1,714 

1,287 

1,743 

1,262 

1,773 

90 

1,496 

1,540 

1,474 

1,563 

1,452 

1,587 

1,429 

1,611 

1,406 

1,636 

1,383 

1,661 

1,360 

1,687 

1,336 

1,714 

1,312 

1,741 

1,288 

1,769 

95 

1,510 

1,552 

1,489 

1,573 

1,468 

1,596 

1,446 

1,618 

1,425 

1,642 

1,403 

1,666 

1,381 

1,690 

1,358 

1,715 

1,336 

1,741 

1,313 

1,767 

100 

1,522 

1,562 

1,503 

1,583 

1,482 

1,604 

1,462 

1,625 

1,441 

1,647 

1,421 

1,670 

1,400 

1,693 

1,378 

1,717 

1,357 

1,741 

1,335 

1,765 

150 

1,611 

1,637 

1,598 

1,651 

1,584 

1,665 

1,571 

1,679 

1,557 

1,693 

1,543 

1,708 

1,530 

1,722 

1,515 

1,737 

1,501 

1,752 

1,486 

1,767 

200 

1,664 

1,684 

1,653 

1,693 

1,643 

1,704 

1,633 

1,715 

1,623 

1,725 

1,613 

1,735 

1,603 

1,746 

1,592 

1,757 

1,582 

1,768 

1,571 

1,779 


( Continua ) 
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TABELA D.5B (Continuagao) 



k'-- 

= 11 

k'-- 

= 12 

k - 

= 13 

k - 

= 14 

k-- 

= 15 

k = 

= 16 

k' = 

= 17 

k = 

= 18 

k = 

: 19 

k = 

20 

n 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

d L 

du 

16 

17 

0,060 

0,084 

3,446 

3,286 

0,053 

3,506 

— 

~ 

— 

— 

— 

— 

— 

— 

— 

~ 

— 

— 

— 

— 

— 

— 

18 

0,113 

3,146 

0,075 

3,358 

0,047 

3,357 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

19 

0,145 

3,023 

0,102 

3,227 

0,067 

3,420 

0,043 

3,601 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

20 

0,178 

2,914 

0,131 

3,109 

0,092 

3,297 

0,061 

3,474 

0,038 

3,639 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

21 

0,212 

2,817 

0,162 

3,004 

0,119 

3,185 

0,084 

3,358 

0,055 

3,521 

0,035 

3,671 

- 

- 

- 

- 

- 

- 

- 

- 

22 

0,246 

2,729 

0,194 

2,909 

0,148 

3,084 

0,109 

3,252 

0,077 

3,412 

0,050 

3,562 

0,032 

3,700 

- 

- 

- 

- 

- 

- 

23 

0,281 

2,651 

0,227 

2,822 

0,178 

2,991 

0,136 

3,155 

0,100 

3,311 

0,070 

3,459 

0,046 

3,597 

0,029 

3,725 

- 

- 

- 

- 

24 

0,315 

2,580 

0,260 

2,744 

0,209 

2,906 

0,165 

3,065 

0,125 

3,218 

0,092 

3,363 

0,065 

3,501 

0,043 

3,629 

0,027 

3,747 

- 

- 

25 

0,348 

2,517 

0,292 

2,674 

0,240 

2,829 

0,194 

2,982 

0,152 

3,131 

0,116 

3,274 

0,085 

3,410 

0,060 

3,538 

0,039 

3,657 

0,025 

3,766 

26 

0,381 

2,460 

0,324 

2,610 

0,272 

2,758 

0,224 

2,906 

0,180 

3,050 

0,141 

3,191 

0,107 

3,325 

0,079 

3,452 

0,055 

3,572 

0,036 

3,682 

27 

0,413 

2,409 

0,356 

2,552 

0,303 

2,694 

0,253 

2,836 

0,208 

2,976 

0,167 

3,113 

0,131 

3,245 

0,100 

3,371 

0,073 

3,490 

0,051 

3,602 

28 

0,444 

2,363 

0,387 

2,499 

0,333 

2,635 

0,283 

2,772 

0,237 

2,907 

0,194 

3,040 

0,156 

3,169 

0,122 

3,294 

0,093 

3,412 

0,068 

3,524 

29 

0,474 

2,321 

0,417 

2,451 

0,363 

2,582 

0,313 

2,713 

0,266 

2,843 

0,222 

2,972 

0,182 

3,098 

0,146 

3,220 

0,114 

3,338 

0,087 

3,450 

30 

0,503 

2,283 

0,447 

2,407 

0,393 

2,533 

0,342 

2,659 

0,294 

2,785 

0,249 

2,909 

0,208 

3,032 

0,171 

3,152 

0,137 

3,267 

0,107 

3,379 

31 

0,531 

2,248 

0,475 

2,367 

0,422 

2,487 

0,371 

2,609 

0,322 

2,730 

0,277 

2,851 

0,234 

2,970 

0,196 

3,087 

0,160 

3,201 

0,128 

3,311 

32 

0,558 

2,216 

0,503 

2,330 

0,450 

2,446 

0,399 

2,563 

0,350 

2,680 

0,304 

2,797 

0,261 

2,912 

0,221 

3,026 

0,184 

3,137 

0,151 

3,246 

33 

0,585 

2,187 

0,530 

2,296 

0,477 

2,408 

0,426 

2,520 

0,377 

2,633 

0,331 

2,746 

0,287 

2,858 

0,246 

2,969 

0,209 

3,078 

0,174 

3,184 

34 

0,610 

2,160 

0,556 

2,266 

0,503 

2,373 

0,452 

2,481 

0,404 

2,590 

0,357 

2,699 

0,313 

2,808 

0,272 

2,915 

0,233 

3,022 

0,197 

3,126 

35 

0,634 

2,136 

0,581 

2,237 

0,529 

2,340 

0,478 

2,444 

0,430 

2,550 

0,383 

2,655 

0,339 

2,761 

0,297 

2,865 

0,257 

2,969 

0,221 

3,071 

36 

0,658 

2,113 

0,605 

2,210 

0,554 

2,310 

0,504 

2,410 

0,455 

2,512 

0,409 

2,614 

0,364 

2,717 

0,322 

2,818 

0,282 

2,919 

0,244 

3,019 

37 

0,680 

2,092 

0,628 

2,186 

0,578 

2,282 

0,528 

2,379 

0,480 

2,477 

0,434 

2,576 

0,389 

2,675 

0,347 

2,774 

0,306 

2,872 

0,268 

2,969 

38 

0,702 

2,073 

0,651 

2,164 

0,601 

2,256 

0,552 

2,350 

0,504 

2,445 

0,458 

2,540 

0,414 

2,637 

0,371 

2,733 

0,330 

2,828 

0,291 

2,923 

39 

0,723 

2,055 

0,673 

2,143 

0,623 

2,232 

0,575 

2,323 

0,528 

2,414 

0,482 

2,507 

0,438 

2,600 

0,395 

2,694 

0,354 

2,787 

0,315 

2,879 

40 

0,744 

2,039 

0,694 

2,123 

0,645 

2,210 

0,597 

2,297 

0,551 

2,386 

0,505 

2,476 

0,461 

2,566 

0,418 

2,657 

0,377 

2,748 

0,338 

2,838 

45 

0,835 

1,972 

0,790 

2,044 

0,744 

2,118 

0,700 

2,193 

0,655 

2,269 

0,612 

2,346 

0,570 

2,424 

0,528 

2,503 

0,488 

2,582 

0,448 

2,661 

50 

0,913 

1,925 

0,871 

1,987 

0,829 

2,051 

0,787 

2,116 

0,746 

2,182 

0,705 

2,250 

0,665 

2,318 

0,625 

2,387 

0,586 

2,456 

0,548 

2,526 

55 

0,979 

1,891 

0,940 

1,945 

0,902 

2,002 

0,863 

2,059 

0,825 

2,117 

0,786 

2,176 

0,748 

2,237 

0,711 

2,298 

0,674 

2,359 

0,637 

2,421 

60 

1,037 

1,865 

1,001 

1,914 

0,965 

1,964 

0,929 

2,015 

0,893 

2,067 

0,857 

2,120 

0,822 

2,173 

0,786 

2,227 

0,751 

2,283 

0,716 

2,338 

65 

1,087 

1,845 

1,053 

1,889 

1,020 

1,934 

0,986 

1,980 

0,953 

2,027 

0,919 

2,075 

0,886 

2,123 

0,852 

2,172 

0,819 

2,221 

0,786 

2,272 

70 

1,131 

1,831 

1,099 

1,870 

1,068 

1,911 

1,037 

1,953 

1,005 

1,995 

0,974 

2,038 

0,943 

2,082 

0,911 

2,127 

0,880 

2,172 

0,849 

2,217 

75 

1,170 

1,819 

1,141 

1,856 

1,111 

1,893 

1,082 

1,931 

1,052 

1,970 

1,023 

2,009 

0,993 

2,049 

0,964 

2,090 

0,934 

2,131 

0,905 

2,172 

80 

1,205 

1,810 

1,177 

1,844 

1,150 

1,878 

1,122 

1,913 

1,094 

1,949 

1,066 

1,984 

1,039 

2,022 

1,011 

2,059 

0,983 

2,097 

0,955 

2,135 

85 

1,236 

1,803 

1,210 

1,834 

1,184 

1,866 

1,158 

1,898 

1,132 

1,931 

1,106 

1,965 

1,080 

1,999 

1,053 

2,033 

1,027 

2,068 

1,000 

2,104 

90 

1,264 

1,798 

1,240 

1,827 

1,215 

1,856 

1,191 

1,886 

1,166 

1,917 

1,141 

1,948 

1,116 

1,979 

1,091 

2,012 

1,066 

2,044 

1,041 

2,077 

95 

1,290 

1,793 

1,267 

1,821 

1,244 

1,848 

1,221 

1,876 

1,197 

1,905 

1,174 

1,934 

1,150 

1,963 

1,126 

1,993 

1,102 

2,023 

1,079 

2,054 

100 

1,314 

1,790 

1,292 

1,816 

1,270 

1,841 

1,248 

1,868 

1,225 

1,895 

1,203 

1,922 

1,181 

1,949 

1,158 

1,977 

1,136 

2,006 

1,113 

2,034 

150 

1,473 

1,783 

1,458 

1,799 

1,444 

1,814 

1,429 

1,830 

1,414 

1,847 

1,400 

1,863 

1,385 

1,880 

1,370 

1,897 

1,355 

1,913 

1,340 

1,931 

200 

1,561 

1,791 

1,550 

1,801 

1,539 

1,813 

1,528 

1,824 

1,518 

1,836 

1,507 

1,847 

1,495 

1,860 

1,484 

1,871 

1,474 

1,883 

1,462 

1,896 


Nota: n = numero de observagoes 


k’ = numero de variaveis explanatorias, excluindo o termo constante. 

Fonte: SAVIN e WHITE, op. cit., reprodugao autorizada pela Econometric Society. 
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TABELA D.6A Valores criticos de funcionamento no teste dos funcionamentos 


N, 










n 2 










2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

2 











2 

2 

2 

2 

2 

2 

2 

2 

2 

3 





2 

2 

2 

2 

2 

2 

2 

2 

2 

3 

3 

3 

3 

3 

3 

4 




2 

2 

2 

3 

3 

3 

3 

3 

3 

3 

3 

4 

4 

4 

4 

4 

5 



2 

2 

3 

3 

3 

3 

3 

4 

4 

4 

4 

4 

4 

4 

5 

5 

5 

6 


2 

2 

3 

3 

3 

3 

4 

4 

4 

4 

5 

5 

5 

5 

5 

5 

6 

6 

7 


2 

2 

3 

3 

3 

4 

4 

5 

5 

5 

5 

5 

6 

6 

6 

6 

6 

6 

8 


2 

3 

3 

3 

4 

4 

5 

5 

5 

6 

6 

6 

6 

6 

7 

7 

7 

7 

9 


2 

3 

3 

4 

4 

5 

5 

5 

6 

6 

6 

7 

7 

7 

7 

8 

8 

8 

10 


2 

3 

3 

4 

5 

5 

5 

6 

6 

7 

7 

7 

7 

8 

8 

8 

8 

9 

11 


2 

3 

4 

4 

5 

5 

6 

6 

7 

7 

7 

8 

8 

8 

9 

9 

9 

9 

12 

2 

2 

3 

4 

4 

5 

6 

6 

7 

7 

7 

8 

8 

8 

9 

9 

9 

10 

10 

13 

2 

2 

3 

4 

5 

5 

6 

6 

7 

7 

8 

8 

9 

9 

9 

10 

10 

10 

10 

14 

2 

2 

3 

4 

5 

5 

6 

7 

7 

8 

8 

9 

9 

9 

10 

10 

10 

11 

11 

15 

2 

3 

3 

4 

5 

6 

6 

7 

7 

8 

8 

9 

9 

10 

10 

11 

11 

11 

12 

16 

2 

3 

4 

4 

5 

6 

6 

7 

8 

8 

9 

9 

10 

10 

11 

11 

11 

12 

12 

17 

2 

3 

4 

4 

5 

6 

7 

7 

8 

9 

9 

10 

10 

11 

11 

11 

12 

12 

13 

18 

2 

3 

4 

5 

5 

6 

7 

8 

8 

9 

9 

10 

10 

11 

11 

12 

12 

13 

13 

19 

2 

3 

4 

5 

6 

6 

7 

8 

8 

9 

10 

10 

11 

11 

12 

12 

13 

13 

13 

20 

2 

3 

4 

5 

6 

6 

7 

8 

9 

9 

10 

10 

11 

12 

12 

13 

13 

13 

14 


Nota: as Tabelas D.6A e D.6B fornecem os valores criticos de n runs para varios valores de N\ (simbolo +) e N 2 (simbolo -). Para o teste de runs de uma amostra, qualquer 
valor de n que seja igual ou menor que o apresentado na Tabela D.6A ou igual ou maior que o da Tabela D.6B e significativo no nivel de 0,05. 

Fonte: SIEGEL, Sidney. Nonparametric statistics for the behavioral sciences. Nova York: McGraw-Hill Book Company, 1956. tabela F, p. 252-253. As tabelas foram 
adaptadas por Siegel da fonte original: SWED, Frieda S.; EISENHART, C. ‘Tables for testing randomness of grouping in a sequence of alternatives.” Annals of 
Mathematical Statistics, v. 14, 1943. Usada com permissao da McGraw-Hill Book Company e do Annals of Mathematical Statistics. 


TABELA D.6B Valores criticos de funcionamento no teste dos funcionamentos 


n 2 

N, 2 

3 4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

2 

3 

4 


9 

9 















5 

9 

10 

10 

11 

11 













6 

9 

10 

11 

12 

12 

13 

13 

13 

13 









7 


11 

12 

13 

13 

14 

14 

14 

14 

15 

15 

15 






8 


11 

12 

13 

14 

14 

15 

15 

16 

16 

16 

16 

17 

17 

17 

17 

17 

9 



13 

14 

14 

15 

16 

16 

16 

17 

17 

18 

18 

18 

18 

18 

18 

10 



13 

14 

15 

16 

16 

17 

17 

18 

18 

18 

19 

19 

19 

20 

20 

11 



13 

14 

15 

16 

17 

17 

18 

19 

19 

19 

20 

20 

20 

21 

21 

12 



13 

14 

16 

16 

17 

18 

19 

19 

20 

20 

21 

21 

21 

22 

22 

13 




15 

16 

17 

18 

19 

19 

20 

20 

21 

21 

22 

22 

23 

23 

14 




15 

16 

17 

18 

19 

20 

20 

21 

22 

22 

23 

23 

23 

24 

15 




15 

16 

18 

18 

19 

20 

21 

22 

22 

23 

23 

24 

24 

25 

16 





17 

18 

19 

20 

21 

21 

22 

23 

23 

24 

25 

25 

25 

17 





17 

18 

19 

20 

21 

22 

23 

23 

24 

25 

25 

26 

26 

18 





17 

18 

19 

20 

21 

22 

23 

24 

25 

25 

26 

26 

27 

19 





17 

18 

20 

21 

22 

23 

23 

24 

25 

26 

26 

27 

27 

20 





17 

18 

20 

21 

22 

23 

24 

25 

25 

26 

27 

27 

28 










890 Apendice D Tabelas estatisticas 


EXEMPLO 2 Em uma sequencia de 30 observances consistindo em 20 sinais + ( = N-\) e 1 0 sinais — 

(= N 2 ), os valores criticos dos funcionamentos no nfvel de significancia de 0,05 sao 9 e 20, 
como mostram as Tabelas D.6A e D.6B, respectivamente. Portanto, se em uma aplicafao for 
constatado que o numero dos funcionamentos e igual ou menor que 9 ou igual ou maior que 
20, podemos rejeitar (no nfvel de significancia de 0,05) a hipotese de que a sequencia obser- 
vada e aleatoria. 


TABELA D.7 Valores criticos de t (= r) de Dickey-Fuller a 1% e 5% e valores de F para testes de raiz unitaria 


Tamanho 
da amostra 

fric* 

tc 

tct" 

Ft 

Ft 

i% 

5% 

1% 

5% 

1% 

5% 

1% 

5% 

1% 

5% 

25 

-2,66 

-1,95 

-3,75 

-3,00 

-4,38 

-3,60 

10,61 

7,24 

8,21 

5,68 

50 

-2,62 

-1,95 

-3,58 

-2,93 

-4,15 

-3,50 

9,31 

6,73 

7,02 

5,13 

100 

-2,60 

-1,95 

-3,51 

-2,89 

-4,04 

-3,45 

8,73 

6,49 

6,50 

4,88 

250 

-2,58 

-1,95 

-3,46 

-2,88 

-3,99 

-3,43 

8,43 

6,34 

6,22 

4,75 

500 

-2,58 

-1,95 

-3,44 

-2,87 

-3,98 

-3,42 

8,34 

6,30 

6,15 

4,71 

00 

-2,58 

-1,95 

-3,43 

-2,86 

-3,96 

-3,41 

8,27 

6,25 

6,09 

4,68 


Os indices nc, c e ct denotam, respectivamente, que nao ha constante, que ha uma constante e que ha uma constante e um termo de tendencia na Equa^ao (21.9.5). 
+ Os valores criticos de F sao para as hipoteses conjuntas de que os termos constante e S em (21.9.5) sao simultaneamente iguais a zero. 

*Os valores criticos de F sao para a hipotese conjunta de que os termos constante, de tendencia e S em (21.9.5) sao simultaneamente iguais a zero. 

Fonte: adaptado de FULLER, W. A. Introduction to statistical time series. Nova York: John Wiley & Sons, 1976, p. 373 (para o teste x), e DICKEY, D. A.; FULLER, W. A. 
“Likelihood ratio statistics for autoregressive time series with a unit root.” Econometrica, v. 49, p. 1.063,1981. 












Apendice 


Telas de resultado do 
EViews , MINITAB, Excel 
e STATA 

Neste apendice mostramos as telas do EViews, MINITAB, Excel e do STATA, que sao alguns dos 
pacotes estatlsticos de regressao e rotinas estatisticas afins mais amplamente utilizados. Para ilustrar- 
mos o resultado destes pacotes, usamos os dados da Tabela E. 1 apresentada no site deste livro. A ta- 
bela fomece dados sobre a taxa de participa 5 ao da for£a de trabalho civil (CLFPR)*, a taxa de 
desemprego civil (CUNR)* e os salarios-hora medios em dolares de 1982 (AHE82)* na economia 
norte-americana no perfodo 1980-2002. 

Embora, sob muitos aspectos, os resultados da regressao basica sejam semelhantes em todos esses 
pacotes, ha diferen£as em como eles os representam. Alguns pacotes apresentam os resultados com 
varios digitos, enquanto outros exibem aproxima 5 oes com quatro digitos. Ha pacotes que apresentam 
as tabelas de analises de variancia (ANOVA) diretamente, enquanto em outros elas precisam ser de- 
rivadas. Existem tambem diferen£as em alguns dos resumos estatlsticos apresentados pelos diversos 
pacotes. Esta alem do escopo deste apendice enumerar todas as diferen£as entre os pacotes. Voce 
pode consultar o site do livro para informa 5 oes adicionais sobre todos os pacotes. 



E.l EViews 

Usando a versao 6 do EViews, fizemos a regressao da for 9 a de trabalho civil contra a taxa de de¬ 
semprego civil e salarios-hora medios e obtivemos os resultados mostrados na Figura E.l 

Este e o formato padrao em que os resultados do EViews sao apresentados. A primeira parte da 
figura fornece os coeficientes de regressao, seus erros padrao estimados, os valores t sob a hipote- 
se nula de que os valores populacionais correspondentes a esses coeficientes sao iguais a zero, e 
os valores p desses t, seguidos do R 2 e do R 2 ajustado. O outro resultado resumido na primeira 
parte diz respeito ao erro padrao da regressao, a soma dos quadrados do reslduo (SQR) e ao valor 
F para testar a hipotese de que os valores (verdadeiros) de todos os coeficientes angulares sao si- 
multaneamente iguais a zero. O criterio de informac;ao de Akaike e o criterio de Schwartz sao 
frequentemente usados para escolher entre modelos concorrentes. Quanto menor o valor desses 
criterios, melhor e o modelo. O metodo de maxima verossimilhan 5 a (MV) e uma alternativa ao 
metodo de mlnimos quadrados. 


*siglas em ingles utilizadas na tabela. 
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FIGURA E.1 

Tela do EViews para a 
regressao da 
participa§ao da for§a 
de trabalho civil. 

Dependente Variavel: CLFPR 

Metodo mfnirno quadrados 

Amostra: 1980-2002 

Observa 5 oes inclufdas: 23 

Variavel Coeficiente 

Erro padrao 

Estatfstica t 

Probabilidade 


c 

80,90133 

4,756195 

17,00967 

0,0000 


CUNR 

20,671348 

0,082720 

28,115928 

0,0000 


AHE82 

21,404244 

0,608615 

22,307278 

0,0319 


R-squared 

0,772765 

Mean dependent var 

65,89565 


Adjusted R-squared 

0,750042 

S,D, dependent var 

1,168713 


S,E, of regression 

0,584308 

Akaike info criterion 

1,884330 


Sum squared resid 

6,828312 

Criterio Schwarz 

2,032438 


Verossimilhan 9 a logaritmica 

218,66979 

Estatfstica F 


34,00731 


Estatfstica Durbin-Watson 

0,787625 

Probabilidade (estatfstica F) 

0,000000 


Obs 

Atual 

Ajuste 

Resfduo 

Grafico de resfduo 

1980 

63,8000 

65,2097 

21,40974 




1981 

63,9000 

65,0004 

21,10044 




1982 

64,0000 

63,6047 

0,39535 




1983 

64,0000 

63,5173 

0,48268 




1984 

64,4000 

64,9131 

20,51311 




1985 

64,8000 

65,1566 

20,35664 




1986 

65,3000 

65,2347 

0,06526 




1987 

65,6000 

65,8842 

20,28416 




1988 

65,9000 

66,4103 

20,51027 




1989 

66,5000 

66,6148 

20,11476 




1990 

66,5000 

66,5819 

20,08186 




1991 

66,2000 

65,8745 

0,32546 




1992 

66,4000 

65,4608 

0,93923 




1993 

66,3000 

65,8917 

0,40834 




1994 

66,6000 

66,4147 

0,18530 




1995 

66,6000 

66,7644 

20,16441 




1996 

66,8000 

66,8425 

20,04251 




1997 

67,1000 

67,0097 

0,09032 




1998 

67,1000 

66,9974 

0,10263 




1999 

67,1000 

67,0443 

0,05569 




2000 

67,2000 

67,1364 

0,06355 




2001 

56,9000 

66,4589 

0,44105 




2002 

66,6000 

65,5770 

1,02304 





Series: Amostras 

residuais 1980-2002 

Observances 23 

Media 

21,39e-14 

Mediana 

0,063552 

Maximo 

1,023040 

Mfnimo 

21,409735 

Desvio padrao, 

0,557116 

Assimetria 

20,593013 

Curtose 

3,752631 

Jarque-Bera 

1,890898 

Probabilidade 

0,388505 


21,5 21,0 20,5 0,0 0,5 1,0 
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Assim como em MQO encontramos aqueles estimadores que minimizam o erro da soma dos 
quadrados, em MV tentamos encontrar aqueles estimadores que maximizam a possibilidade de 
observar a amostra estudada. Sob a hipotese de normalidade do termo de erro, MQO e MV for- 
necem estimativas identicas dos coeficientes de regressao. A estatistica Durbin-Watson e usada 
para verificar se existe correlagao serial de primeira ordem nos termos de erro. 

A segunda parte da tela do EViews apresenta os valores real e ajustado da variavel dependente e a 
diferenga entre as duas, que representa os residuos. Ao lado dos valores, ha uma representagao grafi- 
ca dos residuos em que uma linha vertical denota zero. Os pontos situados a direita da linha vertical 
sao residuos positivos e aqueles a esquerda sao residuos negativos. 

A terceira parte da tela apresenta o histograma dos residuos com o resumo da estatistica. Apresen¬ 
ta a estatistica Jarque-Bera (JB) para testar a normalidade dos termos de erro, assim como a probabi- 
lidade de obterem as estatisticas especificadas. Quanto maior for a probabilidade de obter a estatistica 
JB observada, maior e a evidencia a favor da hipotese nula de que os termos de erro sao normalmen- 
te distribuidos. 

Note que o EViews nao fornece diretamente a tabela de analise de variancia (ANOVA), mas esta 
pode ser facilmente construida por meio dos dados da soma dos quadrados dos residuos, a soma total 
dos quadrados (que devera ser derivada do desvio padrao da variavel dependente) e os graus de liber- 
dade associados. O valor F resultante deste exercicio deve ser igual ao valor F apresentado na pri¬ 
meira parte da tabela. 


E.2 MINITAB 


Usando a versao 15 do MINITAB, e os mesmos dados, obtivemos os resultados de regressao 
apresentados na Figura E.2. O MINITAB apresenta primeiro a regressao multipla estimada, se- 
guida de uma lista de variaveis previsoras (explanatorias), os coeficientes de regressao estima- 
dos e seus erros padrao, os valores T (= t) e os valores p. Nesta tela, S representa o erro padrao 
da estimativa e os valores de R2 e do R2 ajustado sao apresentados na forma percentual. 

A isso se segue a tabela ANOVA habitual. Uma caracteristica tipica da tabela ANOVA e que ela 
reparte a soma dos quadrados da regressao entre os previsores. Assim, do total da soma dos quadrados 
da regressao, 23,226, a parte de CUNR e 21,404 e a de AHE82 e 1,822, sugerindo que a taxa de de- 
semprego civil tem relativamente mais impacto sobre a taxa de participagao da forga de trabalho civil 
do que os salarios-hora medios. 

Uma caracteristica unica do resultado da regressao MINITAB e que ele apresenta observa- 
goes “incomuns” observagoes que de certa forma sao diferentes do resto das observagoes na 
amostra. Ha uma dica sobre tal fato no grafico de residuos apresentado no EViews, pois ele 
mostra que as observagoes 1 e 23 estao consideravelmente afastadas da linha que representa o 
valor zero mostrado la. O MINITAB tambem produz um grafico de residuos semelhante ao do EViews. 
Aqui, St Resid representa os residuos padronizados; os residuos divididos por S, o erro padrao da 
estimativa. 

Assim como o EViews, o MINITAB tambem apresenta a estatistica Durbin-Watson e o histogra- 
ma de residuos. O histograma e uma representagao visual. Se a forma assemelha-se a distribuigao 
normal, possivelmente os residuos tem distribuigao normal. O grafico de probabilidade de distribui¬ 
gao normal serve ao mesmo proposito. Se os residuos estimados situam-se aproximadamente numa 
linha reta, podemos dizer que estao normalmente distribuidos. A estatistica Anderson-Darling (AD), 
um adjunto do grafico de probabilidade de distribuigao normal, testa a hipotese de que a variavel sob 
consideragao (aqui os residuos) tem distribuigao normal. Se o valor p da estatistica AD calculada for 
razoavelmente alto, por exemplo, acima de 0,10, podemos concluir que a variavel tem distribuigao 
normal. Em nosso exemplo, o valor da estatistica AD e 0,481, com um valor p de cerca de 0,21 ou 
21%. Portanto, podemos deduzir que os residuos obtidos do modelo de regressao sao normalmente 
distribuidos. 
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FIGURA E.2 

Tela do MINITAB 
para a taxa de 
participa§ao da mao 
de obra civil. 


Regression Analysis: CLFPR versus CUNR, AHE82 

The regression equation is 

CLFPR 5 81.0 2 0.672 CUNR 2 1.41 AHE82 


Predictor 

Coef 

SE Coef 

T 

P 


Constant 

80.951 

4.770 

16.97 

0.000 


CUNR 

20.67163 

0.08270 

28.12 

0.000 


AHE82 

21.4104 

0.6103 

22.31 

0.032 


S 5 0.584117 

R -Sq 5 77.3% 

R-Sq(adj) 5 75.0% 



Analysis of Variance 





Source 

DF 

SS 

MS 

F 

P 

Regression 

2 

23.226 

11.613 

34.04 

0.000 

Residual Error 

20 

6.824 

0.341 



Total 

22 

30.050 




Source DF 

Seq SS 





CUNR 1 

21.404 





AHE82 1 

1.822 





Unusual Observations 





Obs CUNR 

CLFPR 

Fit 

SE Fit 

Residual 

St Resid 

1 7.10 

63.800 

65.209 

0.155 

21.409 

22.50R 

23 5.80 

66.600 

65.575 

0.307 

1.025 

2.06R 


R denotes an observation with a large standardized residual. 
Durbin-Watson statistic 5 0.787065 


Histogram of the Residuals 

(response is CLFPR) 



Residual 


Probability Plot of RESI1 

Normal 



Mean 

24,479511 

StDev 

0,5569 

N 

23 

AD 

0,481 

p -Value 

0,210 


RESI1 


E.3 Excel 


Usando o Microsoft Excel obtivemos a tela da Tabela E.2. O Excel apresenta primeiro o resumo 
da estatlstica, tal como R 2 , multiplo R - que e a raiz quadrada (positiva) de R R 2 ajustado e os 
erros padrao da estimativa; em seguida apresenta a tabela ANOVA. Depois apresenta os coefi- 
cientes estimados, seus erros padrao, os valores t dos coeficientes estimados e seus valores p. 
Tambem mostra os valores efetivo e estimado da variavel dependente e o grafico de reslduos, 
assim como o grafico de probabilidade de distribuifao normal. 
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TABELA E.2 

Tela do Excel para a 
taxa de participa§ao 
da mao de obra civil 


AN OVA 



df 

SS 

MS 

F 

Significance F 

Regression 

2 

23.22572 

11.61286 

34.03611 

3.65E-07 

Residual 

20 

6.823846 

0.341192 



Total 

22 

30.04957 






Coefficient 

Standard Err 

t Stat 

p-value 

Lower 95% 

Upper 95% 

Intercept 

80.95122 

4.770337 

16.96971 

2.42E-1 3 

71.00047 

90.90196 

CUNR 

-0.671631 

0.082705 

-8.120845 

9.24E-08 

-0.84415 

-0.499112 

AHE82 

-1.410432 

0.610348 

-2.310867 

0.031626 

-2.683594 

-0.13727 


Summary Output 


Regression Statistics 


Multiple R 0.879155 

R Square 0.772914 

Adjusted R 0.750205 

Standard E 0.58411 7 

Observation 23 


Uma caracteristica unica do Excel e que ele apresenta o intervalo de confianqa de 95% (ou qual- 
quer porcentagem especificada) para os verdadeiros valores dos coeficientes estimados. Assim, o 
valor estimado do coeficiente de CUNR e —0,671631 e o intervalo de confianqa do valor verdadeiro 
e de —0,84415 a —0,499112. Essa informayao e muito valiosa para o teste de hipoteses. 


E.4 STATA 

Usando o STATAobtivemos os resultados de regressao da Tabela E.3. O STATA apresenta primei- 
ro a tabela de analise de variancia com o resumo estatistico tal como R 2 , R 2 ajustado e REQM (Raiz 
do Erro Quadratico Medio), que e apenas o erro padrao da regressao. 

Em seguida fornece os valores dos coeficientes estimados, seus erros padrao, seus valores t, 
seus valores p da estatfstica t e o intervalo de confian?a de 95% para cada um dos coeficientes 
da regressao, que e semelhante a safda do Excel. 


E.5 Comentarios finais 

Em nosso exemplo, apresentamos apenas os resultados basicos desses pacotes. Mas e importante 
observar que pacotes como o EViews e o STATA sao muito abrangentes e contem muitas das tecnicas 
econometricas discutidas neste livro. Uma vez que voce saiba acessar esses pacotes, executar sub- 
rotina e uma questao de pratica. Se voce quiser aprofundar-se na econometria, adquira um ou mais 
destes pacotes. 
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TABELA E.3 

Tela do STATA para a 
taxa de participagao 
da mao de obra civil. 


/_ / _ / / _ / 

_ / / / _ / / / _ / 

Statistics/Data Analysis 

Project: Data of Table E.1 

tm 

— / 7 T - 7 

_/ / /_/ / /_/ 8.0 Copyright 1984-2003 

Statistics/Data Analysis Stata Corporation 

4905 Lakeway Drive 
College Station, Texas 77845 USA 
800-STATA-PC http://www.stata.com 
979-696-4600 stata@stata.com 


gress clfpr cunr ahe82 


979-696-4601 (fax) 


Source 

SS 

df 

MS 

Number of obs 
F(2, 20) 

Prob > F 
R-squared 

Adj R-squared 
Root MSE 

= 23 

= 34.04 

Model 

Residual 

Total 

23.2256929 

6.82384072 

30.0495337 

2 

20 

22 

11.6128465 

.341192036 

1.36588789 

= 0.0000 
= 0.7729 
= 0.7502 
= .58412 


clfpr 

Coef. 

Std. Err. 

t 

P>\t\ 

[95% Conf. Interval] 

cunr 

.6716305 

.0827045 

8.12 

0.000 

.8441491 

.4991119 

ahe82 

1.410433 

.6103473 

2.31 

0.032 

2.683595 

.1372707 

_cons 

80.95122 

4.770334 

16.97 

0.000 

71.00048 

90.90197 


Referencias 


www. eviews. com 
www.stata.com 
www.minitab.com 
Microsoft Excel 

CARTER, Hill R.; GRIFFITHS, William E.; JUDGE, George G. Using Excel for undergraduate 
econometrics. Nova York: John Wiley & Sons, 2001. 





















Apendice Hi 

r 

Dados economicos 
na Internet* 


Economic Statistics Briefing Room: uma excelente fonte de dados sobre produgao, renda, emprego, 
desemprego, ganhos, atividades de produgao e empresariais, pregos e moeda, mercados de credito 
e valores mobiliarios e estatlsticas internacionais. 

http://www.whitehouse.gov/fsbr/esbr.html 

Federal Reserve System Beige Book: fomece um resumo da conjuntura economica atual pelo Federal 
Reserve District. Ha 12 Federal Reserve Districts. 

http://www.federalreserve.gov/FOMC/BEIGEBOOK 

Homepage do National Bureau of Economic Research (NBER): este renomado instituto privado de 
pesquisas economicas reune dados extensivos sobre pregos de ativos, mao de obra, produtivi- 
dade, oferta de moeda, indicadores de ciclos de negocios etc. O NBER tem muitos links para 
outros sites. 

http://www. nber.org 

Panel Study: fornece dados sobre pesquisa longitudinal de amostras representativas de indivfduos e 
famflias dos Estados Unidos. Esses dados sao coletados anualmente desde 1968. http://www. 
psidoline.isr.umich.edu/ 

Resources for Economists on the Internet: fonte abrangente de informagoes e dados sobre muitas ativi¬ 
dades economicas com links para grande numero de sites. Fonte bastante valiosa para economistas 
academicos e nao academicos. 

http://rfe.org/ 

American Stock Exchange: informagoes sobre aproximadamente 700 empresas registradas no 
segundo maior mercado de agoes. 

http://www.amex.com/ 

Bureau of Economic Analysis ( BEA ) Homepage: esta agenda do Departamento de Comercio dos 
Estados Unidos, que publica a Survey of Current Business, e uma excelente fonte de dados sobre 
todos os tipos de atividades economicas. 

http://www.bea.gov/ 

CIA Publications: esta fonte inclui o World Fact Book (anual) e o Handbook of International 
Statistics. 

http://www.cia.gov/library/publications 


*Adaptado de COLE, Don (Ed.). Annual editions: microeconomics 98/99. Connecticut: Dushkin/McGraw-Hill, 
1998. E preciso notar que essa lista nao e, de modo algum, opcional. As fontes relacionadas aqui sao atualizadas 
continuamente. 
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Energy Information Administration (DOE): informa 5 oes e dados economicos sobre cada catego- 
ria de combustfvel. 

http://www.eia.doe.gov/ 

FRED Database: a filial do Federal Reserve Bank em St. Louis publica dados historicos econo¬ 
micos e dados sociais, que incluem taxas de juro, indicadores monetarios e de negocios, taxas 
de cambio etc. 

http://research.stlouisfed.org/fred2/ 

International Trade Administration: oferece muitos links para estatfsticas comerciais, progra- 
mas de ambito nacional etc. 

http://trade.gov/index.asp 

STAT-USA Databases: o National Trade Data Bank oferece a fonte mais abrangente de dados do 
comercio internacional e informa 5 oes sobre promo§ao de exporta£6es. Ha tambem dados 
extensivos sobre condi£6es demograficas, polfticas e socioeconomicas de diversos pafses. 

http://www.stat-usa.gov/ 

Statistical Resources on the Web/Economics: excelente fonte de dados estatfsticos coletados de 
varios organismos federais, indicadores economicos. Federal Reserve Board, dados sobre pre£os ao 
consumidor e links para outras fontes. 

http://www.lib.umich.edu/govdocs/stats.html 

Bureau of Labor Statistics: homepage de dados relacionados a varios aspectos de emprego, de- 
semprego e ganhos, alem de links para outros sites de estatfstica. 

http://www.stats.bls.gov/ 

Homepage do U.S. Census Bureau: fonte primaria de dados sociais, demograficos e economicos 
sobre renda, emprego, distribui§ao de renda e pobreza. 

http://www.census.gov/ 

General Social Survey: dados de entrevistas pessoais do levantamento anual de domicflios dos Esta- 
dos Unidos que come 50 u em 1972. Mais de 35 mil entrevistados responderam a cerca de 2.500 
perguntas diferentes abrangendo uma variedade de dados. 
http://www.norc.org/GSS-Fwebsite/ 

Institute for Research on Poverty: dados coletados por um centra de pesquisa universitaria nao parti- 
dario e sem fins lucrativos sobre uma variedade de questoes relacionadas a pobreza e a desigualdade 
social. 

http://www.irp.wisc.edu/ 

Social Security Administration: site oficial da Social Security Administration (Previdencia Social) 

com uma variedade de dados. 

http://www.ssa.gov/ 
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Estudo de painel, 879 
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Bolsa de valores de Nova 
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Hipotese de expectativas racionais 
(ER), 627 

Hipotese de mercado de capital 
eficiente, 736 

Hipotese de renda permanente de 
Friedman, 166 

Hipotese de renda permanente por 
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LC (veja Lucres corporativos) 

Lei da gravidade, 43 

Lei da gravidade de Newton, 43 

Lei da regressao universal, 39 

Lei das expectativas iteradas, 811 

Lei de Ohm, 42 

Leptokurtic, 812 

Limiar GARCH (TGARCH), 793 
Limite de confianga inferior, 129 
Limite de probabilidade (plim), 675 
Limite superior de confianga, 129 
Limites de confianga, 129 
Linear no parametro (premissa 1), 84 
Linearidade, 62-63 
de BLUE, 93 
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quadrados, 112-113 
nas variaveis, 62 
nos parametros, 63 
Linha caractenstica, 154, 166,721 
Linha de regressao, 40 
Linha de regressao amostral, 67 
Linha de regressao populacional 
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Logaritmos comuns, 200 
Logaritmos naturais, 200, 201 
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M 

Manipulagao de dados, 419 
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Matriz, inversao, 840 
Matriz adjunta, 843 
Matriz de cofatores, 843 
Matriz de correlagao, 355, 855 
Matriz de dados, 847 
Matriz de identidade, 836 
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849, 853-854, 871-782 
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simetrica, 849 
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Matriz nao singular, 841 
Matriz nula, 836 
Matriz quadrada, 835, 843 
Matriz quadrada inversa, 843-844 
Matriz simetrica, 836 
Matriz singular, 841 


Matriz unitaria, 836 
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adjunta, 843 
cofator, 843 
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igual, 837 
nula, 836 
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quadrada, 835 
simetrica, 836 
vetor nulo, 836 
Matrizes iguais, 837 
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variaveis, 124-126 
MCE (veja Mecanismo de corregao 
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aplicagoes de, 33 
de consumo, 28 
de Klein, 673 
estimagao de, 29 
exemplo de, 28 
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regressao linear) 
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Media movel de segunda ordem 
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Media movel primeira ordem 
(MM(l)), 770 
Medigao de volatilidade: 

ARCH estiver presente, 790 
Durbin-Watson d e efeito ARCH, 
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em series temporais financeiras, 

784- 785 

exemplo da taxa de cambio Estados 
Unidos/Reino Unido, 

785- 788 


modelo GARCH, 790 
variagoes nos pregos na bolsa de 
valores de Nova York, 789 
Medida de elasticidade, 177-179 
Medida de estoque de moeda, 157 
Medida de taxa de crescimento, 
179-180 

MEF {veja Modelo de efeitos fixos) 
Melhor estimador linear nao 

tendencioso, 93-94, 424, 
823, 872-873 

Melhores estimadores lineares, 122, 
246n, 823, 

Menor, 842 

Mesocurtica, 812 

Metodo da descida mais mgreme, 

527 

Metodo de busca direto, 527 
Metodo de duas etapas de Durbin, 
456 

Metodo de informagoes completas, 
705 

Metodo de linearizagao, 535-536 
Metodo de linearizagao iterativa, 527 
Metodo de Marquard, 528n 
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de informagoes completas 
(MVIC), 706 

Metodo de momentos (MMO), 106, 
822 

Metodo de momentos generalizado 
(GMM), 822 

Metodo de primeira diferenga, 
443-444, 598 

Metodo de variaveis dummy, 301, 
303n,307-308 

Metodo de variaveis instrumentais 
(IV), 632-633 
Metodo Holt-Winters, 768 
Metodo iterativo C-0 {veja Metodo 
iterativo Cochran-Orcutt) 
Metodo iterativo de Gauss-Newton, 

528 

Metodo iterativo de Newton-Raphson, 
528 

Metodo IV {veja Metodo de 

variaveis instrumentais) 
Metodo linear de Holt, 768 
Metodo livre de derivada, 527 
Metodo MQG factfvel (MQSGF), 
447, 448 

Metodo MVIC (maxima 

verossimilhanga de 
informagoes 
completas),706 
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Metodo Newey-West, 448 
Metodo tentativa e erro, 525-527 
Metodologia BJ (veja Metodologia 
Box-Jenkins) 

Metodologia Box-Jenkins (BJ), 
767-768 

estimagao do modelo ARIMA, 

776 

etapas, 771 

identificagao, 772-776 
previsao, 777-778 
sazonalidade, 778 
verificagao de diagnostico, 777 
Metodologia econometria 
tradicional, 26 

Metodos de equagoes simultaneas, 
705-730 

abordagens da estimagao, 

705- 706 

erros padrao dos estimadores 
MQ2E, 729 
exemplos, 718-719 
mmimos quadrados de dois 
estagios, 712-715 
minimos quadrados indiretos, 
708-711 

modelos recursivos e MQO, 

706- 708 

vies em estimadores de 
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indiretos, 728 

Metodos de informagao limitada, 705 
Metodos de suavizagao exponencial, 
767 

Metodos estatisticos nao 

parametricos, 752 
Metodos iterativos, 446-447 
Micronumerosidade, 335, 340 
Micronumerosidade exata, 335 
Micropainel de dados (veja Dados 
em painel) 

Minimos quadrados de dois estagios 
(MQ2E), 712-715, 729 
Mmimos quadrados generalizados 
(MQG), 376-378, 
441-448, 867-868 
Minimos quadrados generalizados 

estimados (MQEG), 447, 
864 

Mmimos quadrados indiretos (MQI), 
685, 708-711, 728 
Mmimos quadrados nao lineares 
(MQNL), 524 

Mmimos quadrados ordinarios 
(MQO), 48-106 (veja 


tambem Estimagao de 
MQO; Estimadores de 
MQO) 

e experimentos de Monte Carlo, 
104-105 

e modelos recursivos, 706-708 
exemplos, 102-104 
metodo de, 79-83 
MQG vs., 378 

precisao/erros-padrao, 91-93 
premissas, 84-91 
propriedade MELNT, 872-873 
Qualidade do ajustamento, 95-99 
teorema de Gauss-Markov, 71-73 
Mmimos quadrados ponderados 
(MQP), 378, 393, 
412-413 

Mmimos quadrados recursivos 
(MQRE), 496 

Mmimos quadrados restritos (MQR), 
262-264, 480, 870-871 
MINITAB, 893-894 
MM (veja Medias moveis) 

MMG (Metodo de momentos 
generalizado), 822 
MMO (veja Metodo de momentos) 
MNRL (veja Modelo neoclassico de 
regressao linear) 
Modelagem de dados contaveis, 
573-576 

Modelagem econometrica, 466-510 
criterio de selegao de modelo, 
467,491-496 
criterio C p de Mallows, 493 
criterio de informagao de 
Akaike, 492 

criterio de informagao de 
Schwarz, 492^193 
criterio R 2 , 491 
previsao qui-quadrado, 494 
R 2 ajustado, 492 
uma advertencia sobre os 
criterios, 494 

dados ausentes em, 497-498 
diretrizes para, 509 
discrepantes/alavancagem/ 

influencia em, 494^198 
e propriedade de nao 

tendenciosidade, 481 
erro de distribuigao nao normal 
em, 507-508 
erros de especificapao 

consequencias de, 469—473 
testes de, 473—481 
tipos de, 467-469 


erros de medida, 481—482 
exemplo, 483^484 
na variavel dependente T, 481 
na variavel explanatoria X , 

482 

especificapao de termo de erro 
estocastico, 485 
exemplos de, 498-507 
mmimos quadrados recursivos em, 
496 

modelos aninhado vs. nao 
aninhado, 485—486 
teste de erros de especificapao, 

473 

teste de falhas de previsao de 
Chow, 497 

testes de hipoteses nao aninhadas, 
486-491 

abordagem de discernimento, 
486 

abordagem de discriminagao, 
486-487 

teste F nao aninhado, 486^-87 
teste J de Davidson-MacKinnon, 
488-489 

variaveis explanatorias estocasticas 
em, 508 
Modelo (termo), 27 
Modelo abrangente, 466 
Modelo ARCH (veja Modelo de 
heterocedasticidade 
autorregressiva 
condicional) 

Modelo ARIMA (veja Modelos de 
media movel 
autorregressivos 
integrados) 

Modelo classico de regressao linear 
(MRLC): 
definipao, 37 

e experimentos Monte Carlo, 
104-105 

exemplos de, 99-104 
precisao/erros-padrao, 91-93 
premissas, 84-91, 106, 325-328 
problemas de aplicagao, 328 
qualidade do ajustamento, 95-99 
teorema de Gauss-Markov, 93-95 
Modelo de acelerador de 

investimento, 618 
Modelo de acelerador de 

macroeconomico, 682 
Modelo de acelerador flexivel, 628 
Modelo de ajustamento parcial 
(MAP), 627-629 
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Modelo de ajuste de estoque, 628 
Modelo de coeficientes constantes 

(veja Modelo de regressao 
MQO Combinados) 
Modelo de componentes de erro (veja 
Modelo de efeitos 
aleatorio) 

Modelo de correlagao serial, 655 
Modelo de crescimento logistico, 

530 

Modelo de defasagem distribuida de 
Almon, 640-647 
Modelo de defasagem distribuida 
finita, 619 

Modelo de defasagem distribuida V 
invertido, 658 

Modelo de defasagem infinito, 619 
Modelo de efeito fixo (MEF), 592, 
602-603 

Modelo de efeito fixo bidirecional, 
594 

Modelo de efeitos aleatorios (REM), 
598-602 

Modelo de elasticidade constante, 

178 

Modelo de equagao unica, 27 
Modelo de equagoes multiplas, 27 
Modelo de expectativas adaptativas, 
625-627, 629 

Modelo de formagao de pregos de 

ativos (CAPM), 165-166, 
512-513,720-721 
Modelo de gastos publicos de 
Pindyck-Rubinfeld, 
698-699 

Modelo de heterocedasticidade 

autorregressiva condicional 
(ARCH), 449^150, 767 
da taxa de inflagao dos 

uorte-americana, 791-792 
na medida de volatilidade, 784, 
787-788 

Modelo de heterocedasticidade 
autorregressiva 
condicional generalizada 
(GARCH) 450, 767, 790 
Modelo de mercado da teoria da 
carteira, 166, 167 
Modelo de multiplicador de 

Lagrange (LM), 672 
Modelo de passeio aleatorio (MPA), 
735-736 

Modelo de probabilidade linear 
(MPL), 540-545 


alternativas ao, 549-550 
aplicagoes de, 545-549 
ausencia de normalidade dos 
termos de erro, 541 
definigao, 540 

efeito da variagao unitaria no valor 
do regressor, 567-568 
exemplo, 543-545 
impossibilidade de satisfazer 0 e 
1,542 

qualidade do ajustamento, 
542-543 

variancias heterocedasticas dos 
termos de erro, 541-542 
Modelo de regressao aparentemente 
nao relacionado, 595, 779 
Modelo de regressao Box-Cox, 203 
Modelo de regressao com duas 
variaveis, 165-204 
e erro estocastico, 190-192 
e escala/unidades de medigao, 
172-175 

em variaveis padronizadas, 
175-177 

estimagao de intervalo. 128-130 
intervalos de confianga, 
130-132 

pre-requisitos estatisticos, 128 
exemplo hipotetico, 34-37 
medigao de crescimento, 179-182 
medigao de elasticidade, 177-179 
modelos funcionais de, 176 
modelo log-linear, 177-179 
modelos recfprocos, 183-189 
modelos semilog, 179-183 
problema de estimagao, 78-117 
coeficiente de determinagao r, 
95-99 

exemplos, 102-103 
experimentos Monte Carlo, 
104-105 

metodo mmimos quadrados 
ordinarios, 78-83 
modelo de regressao linear 
classico, 84—91 
precisao/erros-padrao, 91-93 
teorema de Gauss-Markov, 
93-95 

regressao que passa pela origem, 
165-171 

teste de hipotese, 133-143 
abordagem intervalo de 
confianga, 134-135 
abordagem teste de 

significancia, 135-139 


aceitagao/rejeigao de hipotese, 

139 

escolha do nivel de 
significancia, 141 
formagao de hipotese,nula/ 
altemativa 140-141 
hipotese zero nula / regra 2 1 , 

140 

nivel exato de significancia, 142 
significancia estatistica vs. 
pratica, 142-143 

Modelo de regressao de Poisson, 
573-576 

Modelo de regressao de tres 
variaveis: 

coeficiente de correlagao multipla, 
214 

coeficiente de determinagao 
multiplo, 213-214 
coeficientes de regressao parcial, 
207-209 

estimagao coeficientes parciais de 
regressao, 209-212 
exemplo, 214-215 
fungao de produgao de 

Cobb-Douglas, 222-224 
interpretagao da equagao de 
regressao, 207 

notagao/premissas, 205-207 
R 2 ajustado, 217-222 
variaveis padronizadas, regressao 
com, 215-216 

vies de especificagao, 216-217 

Modelo de regressao exponencial, 
177 

Modelo de regressao linear com duas 
variaveis, 37 

Modelo de regressao linear de 
variavel K, 846-848 

Modelo de regressao linear gaussiano 
(veja Modelo classico de 
regressao linear) 

Modelo de regressor estocastico, 85, 
326-327 

Modelo de tendencia linear, 181 

Modelo de variavel dummy de 
mmimos quadrados 
(LSDV), 592-595 

Modelo de vetores autorregressivos 
(VAR), 648, 650, 767, 

769 

aplicagao na economia do Texas, 
784 

causalidade, 781-783 
dados de series temporais, 778 
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estimagao, 779-780 
previsao, 780-781 
problemas, 783-784 
Modelo demanda e oferta, 668-669 
Modelo duplo-log, 177 
Modelo GARCH (veja Modelo de 
heterocedasticidade 
autorregressiva 
conditional generalizada) 
Modelo GARCH-M (GARCH na 
media), 793 

Modelo Glogit (veja Modelo logit 
agrupado) 

Modelo Gprobit (veja Modelo probit 
agrupado) 

Modelo I de Klein, 673, 719-720 
Modelo IS (multiplicador de 
Lagrange), 671 

Modelo IS da macroeconomia, 
671-672 

Modelo Keynesiano de determinagao 
de renda, 669-670 
Modelo Koyck, 621-625 

combinagao de expectativas 

adaptativas e modelos de 
ajustamento parcial, 
629-630 

defasagem media (mediana), 623 
e modelo de ajustamento parcial, 
627-629 

e modelo de expectativas 

adaptativas, 625-627 
uso de exemplo, 623-625, 627 
modelo lin-log, 179, 182-183 
Modelo log hiperbole, 189 
Modelo logaritmico reciproco, 189 
Modelo logit, 550-555 
agrupado, 555-558 
dados nao agrupados, 558-563 
efeito da variagao unitaria no valor 
do regressor, 567-568 
estimagao de, 552-555 
estimagao ML, 552-555 
multinomial, 576-577 
ordinal, 576 
probit vs., 567 

Modelo logit agrupado (glogit), 
555-558 

Modelo log-lin, 179-183 
Modelo log-linear, 272-273 
Modelo log-log, 177-178 
Modelo matematico de consumo, 27 
Modelo MQVD (veja Modelo de 
mlnimos quadrados de 
variavel dummy) 


Modelo MQVD de efeito fixo, 
592-595 

Modelo neoclassico de regressao 
linear (MNRL), 87 
Modelo normal de regressao linear 
classico (MNRLC), 
118-123 
definigao, 37 

distribuigao de probabilidade dos 
termos de erro, 118-119 
metodo da maxima 

verossimilhanga, 122 
premissa da normalidade, 119-120 
Modelo Probit, 563-568 

com dados agrupados, 564-567 
com dados desagrupados, 567 
efeito de variagao unitaria sobre o 
valor do regressor em, 567 
estimagao ML, 585-586 
logit vs., 568-570 
multinomial, 576 
ordinal, 576 

Modelo probit agrupado (gprobit), 
564-567 

Modelo regressao multipla, 37 
Modelo St. Louis revisado, 722-723 
Modelo SURE (veja Modelo de 

regressao aparentemente 
nao relacionada) 

Modelo Tobit, 570-573 
Modelo triangular de defasagem 

distribufda (aritmetico), 

655 

Modelo(s) de regressao. 176 
Box-Cox, 203 
e erro estocastico, 190-191 
medigao de crescimento, 179-182 
medigao de elasticidade, 177-179 
modelo log-linear, 177-179 
modelos reclprocos, 183-189 
modelos semilog, 179-182 
Modelo(s) de regressao linear 63 
estimagao de, 524-525 
exemplo de, 28 
log-linear vs., 272-273 
nao linear vs., 523-524 
Modelos ANCOVA (veja Analise de 
modelos de covariancia) 
Modelos aninhados, 485 
Modelos ANOVA (veja Analise de 
modelos de variancia) 
Modelos AR (veja Modelos 
autorregressivos) 

Modelos causais (veja Modelos 
recursivos) 


Modelos de aprendizagem de erro, 
371 

Modelos de autorregressao (AR), 
435,489,614, 769-770 
detectando a autocorrelagao em, 
633-634 

estimagao de, 630-631 
exemplos de, 635-640 
metodo de variaveis 

instrumentais, 632-633 
Modelos de dados em painel, 587 
algumas solicitagoes, 602-603 
estimador de efeito fixo dentro do 
grupo, 595-598 

estimadores, propriedades de, 605 
exemplos, 589-590 
modelo de efeitos aleatorios, 
598-602 

modelo de regressao MQO 

combinados, 590-592 
modelo LSDV de efeito fixo, 
592-595 
vantagens, 588 
variaveis dummy, 296 
Modelos de defasagem distribuida, 
487, 489,614, 620-625, 
640-647 

Modelos de desequilibrio, 309 
Modelos de despesas de Engel, 182 
Modelos de duragao, 577-578 
Modelos de equagoes simultaneas, 
667-682 

exemplos, 668-673 
natureza, 667-668 
Modelos de media movel 

autorregressivos 
integrados (ARIMA), 
767-771 

da taxa de cambio yen/dolar, 791 
estimagao de, 776 

Modelos de regressao com mudanga 
(SRM), 306n, 309 
Modelos de regressao de equagao 
unica, 49, 768 

Modelos de regressao de equagoes 
simultaneas, 768 

Modelos de regressao intrinsecamente 
nao lineares, 524-525 
Modelos de regressao nao linear 
(MRNL), 62,-63, 
523-532 
estimagao, 525 
exemplos, 528-532 
linear vs., 523-524 
metodo da busca direta, 527 
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metodo da tentativa e erro, 
525-527 

metodo de linearizagao iterativo, 
527-528 

otimizagao direta, 527 
Modelos de regressao variavel 

dependente limitada, 571 
Modelos de resposta qualitativa, 
550-598 

modelo de probabilidade linear, 
540-545 

modelo de regressao Poisson, 
573-576 

modelo logit, 550-552, 585-586 
modelo probit, 563-568 
modelo tobit, 570-573 
modelos de duragao, 577 
modelos multinomials, 576 
modelos ordinais, 576 
natureza, 538-539 
variagao unitaria no valor do 
regressor, 567 

Modelos de variavel dependente 
dicotomica, 309 

Modelos dinamicos de regressao, 
420, 614 

Modelos multinomials, 576 
Modelos nao aninhados, 485^-86 
Modelos Normit ( veja Modelo 
Probit) nao sao 
estatisticamente 
significativos, 135 
Modelos ordinais, 576 
Modelos reciprocos, 183-189 
Modelos recursivos, 706-708 
Modelos semilog, 179-183 
Modelos teoricos A, 783 
Modelos triangulares, 706, 707, 

713n 

Momento, 106 

Momentos altos de distribuigao de 
probabilidade, 811-812 
MPL ( veja Modelo de probabilidade 
linear) 

MPR (veja Modelo de passeio 
aleatorio) 

MPS (propensao marginal a poupar), 
238 

MQ2E (veja Minimos quadrados de 
dois estagios) 

MQG (veja Minimos quadrados 
generalizados) 

MQGE (minimos quadrados 

generalizados estimados), 
864 


MQGF (veja Metodo MQG 
factiveis) 

MQI (veja Minimos quadrados 
indiretos) 

MQNL (minimos quadrados nao 
linear), 525 

MQO (veja Minimos quadrados 
ordinarios) 

MQP (veja Minimos quadrados 
ponderados) 

MQRE (minimos quadrados 
recursivos), 496 
MQRL (veja Minimos quadrados 
restritos) Estimagao 
robusta, 328n 

Mudangas estruturais, teste de, 
266-271,752-753 
Multicolinearidade, 329-358 
alta mais imperfeita, 334 
consequencias praticas, 336-340 
intervalos de confianpa, 339 
micronumerosidade, 340 
razoes t, 338-339 
sensibilidade a pequenas 
alteragoes nos dados, 
339-340 

variancia do estimador de 
MQO, 210-211 

consequencias teoricas, 334-335 

definipao, 330 

detecgao, 345-349 

efeitos da, 353 

exemplo, 341-345 

exemplo de dados de Longley, 354 

fatores, 332 

medidas corretivas, 349-353 
nao fazer nada, 349 
procedimentos de regra pratica, 
349-353 

natureza da, 330-332 
perfeita, 332-334 
premissa de ausencia, 206 
Multicolinearidade perfeita, 332-334 
Multiplicagao, matriz, 838-840 
Multiplicagao de matriz, 838 
Multiplicagao escalar, 837 
Multiplicador da renda (M), 32 
Multiplicador de curto prazo, 615 
Multiplicador de defasagem 
distribuida, 616 

Multiplicador de longo prazo, 616 
Multiplicadores de impacto, 615, 

685 

MV (veja Maxima verossimilhanga) 


N 

N (numero de observagoes), 44 
Nao estacionarios, 735, 753-755 
"Nao fazer nada", 349 
Nao ha autocorrelagao entre termos de 
erro (premissa 5), 88-89 
Nao viesado, 517-518, 822, 827 
de estimadores minimos 

quadrados, 112-113 
de MELNT, 93 
premissa, 205, 372 
National Bureau of Economic 

Research (NBER), 897 
National trade data bank, 898 
Navalha de Occam, 66 
NBER (National Bureau of Economic 
Research ), 897 
NID (distribuigao normal e 

independente), 119 
Nivel critico, 563 

Nivel de significancia, 128, 820, 829 
escolha, 141 
exato, 142 

na presenga de garimpagem de 
dados, 474-475 

Nivel de significancia nominal, 

473- 474 

Nivel de significancia verdadeiro, 

474- 475 

Nivel exato de significancia (valor 
p), 142, 831 
Nivel limiar, 563 
NLRM (modelo neoclassico de 
regressao linear), 85 
No (conhecido como antemao), 306 
Normalidade (premissa 10), 246-247 
para termos de erro, 118 
propriedades dos estimadores de 
MQO sob, 120-122 
razoes para usar, 119-120 
Normalidade assintotica, 827 
Normit, 565 

NPP (veja Grafico de probabilidade 
normal) 

Number crunching, 474 

o 

Omissao, de uma variavel relevante, 
468-472 

Omissao de variaveis, 475-481 
Operagoes matriciais, 837-840 
inversao, 840 
multiplicagao, 838 
multiplicagao escalar, 837 
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soma, 837 
subtragao, 837 
transposigao, 839-840 
Operador de defasagem, 738n 
Operador de primeira diferenga, 420 
Operador de produto (O), 797 
Operador de somatoria (X), 796 
Operador de somatorio duplo (SZ), 
796 

Ordem, 834 
Otimizagao direta, 527 

P 

Padrao de hamburger, 159 
Painel balanceado, 48, 589 
Painel curto, 589 
Painel de dados, 47-48 
Painel desbalanceado, 48, 589 
Painel longo, 598 
Parametro de deslocamento, 737 
Parametros, 27 

Parametros de cointegragao, 756 
Parametros de sujeira, 592 
Parcimonia, 66 

Paridade do poder de compra (PPC), 
158 

Participagao da forga de trabalho 

(PFT), 74, 538, 546-547, 
868 

Passeio aleatorio puro, 739 
PDL (veja Defasagem distribuida 
polinomial) 

PED (veja Processos estacionarios de 
diferenga) 

Pesquisas de opiniao do Instituto 
Gallup, 46 

PFT (veja Participagao da forga de 
trabalho) 

PGD (Processo gerador de dados), 
732 

PIB (veja produto interno bruto) 
Platicurticas, 812 

Plim (limite de probabilidade), 675 
Plotagem sequential do tempo, 432 
PMC (veja Propensao marginal a 
consumir) 

PNB (produto nacional bruto), 26 
Polinomios ortogonais, 353 
Ponto de influencia, 495 
Pontos amostrais, 797 
Populagao, 59, 809 
Porcentagens, logaritmos e, 202 
Pos-multiplicado, 838 
Posto de uma matriz, 842-843 


PPP (paridade do poder de compra), 
158 

PR (regressao populacional), 62 
Precedencia, 648 
Precisao, 91-93 
Precisao, dos dados, 50 
Pregos do ouro, 110 
Premissas, de MCRL, 84-91, 206, 

325- 328, 

ausencia de vies de especificagao 
(premissa 9), 206, 235 
desrespeito, 106 

distribuigao normal (premissa 10), 
325, 327 

em notagao matricial, 848-849 
especificado corretamente 
(premissa 9), 466 
homocedasticidade (premissa 4), 
87-88 

independentes do termo de erro 
(premissa 2), 84-85 
linear nos parametros (premissa 
1), 84 

nao ha autocorrelagao entre os 
termos de erro (premissa 
5), 88-89 

nao ha de colinearidade (premissa 
8), 206 

observagoes e parametros 
(premissa 6), 89 

valor de media zero (hipotese 3), 
86, 327 

valores fixos (premissa 2), 84-85, 

326- 327 

variabilidade dos valores de x 
(premissa 7), 89 
Pre-multiplicado, 838 
Pre-teste, 747 
Previsao 

com regressao multipla, 271 
formulagao de matriz, 858-859 
individual, 147-148, 164 
media, 146-147 
variancia de, 858 
Previsao da taxa de graduagao, 
581-582 

Previsao de classificagao de um 
titulo, 548 

Previsao economica, 767-769 
Previsao fora da amostra, 491 
Previsao individual, 147-148, 164, 
858 

Previsao media, 146-147, 163-164, 
858-589 

Previsao qui-quadrado, 494 


Previsao: 

ARIMA, 468 
economica, 767-769 
na metodologia de BJ, 778 
regressao de equagoes 
simultaneas, 768 
suavizagao exponential, 767 
VAR, 769, 780-781 
Principio abrangente, 488 
Princlpio da analogia, 106, 822 
Principio KISS, 509 
PRL (veja Linha de regressao 
populacional) 
Probabilidade, 797-798 
Probabilidade de cometer erro do Tipo 
I, 129n, 141 

Problema de estimagao, 819 
Problema de heterogeneidade, 46 
Problema de identificagao, 665, 
683-696 
definigao, 686 

identificagao exata, 688-691 
notagoes/definigoes usadas em, 
683-686 

subidentificagao, 686-688 
superidentificagao, 691-692 
Problema de raiz unitaria, 738 
Processo de autorregressivo e medias 
moveis (ARMA), 770 
Processo de Poisson, 539 
Processo de ruldo branco, 735 
Processo de ruldo branco gaussiano, 
735 

Processo de tendencia estacionaria 
(PTE), 739 

Processo de tendencia estacionaria, 
754-755 

Processo gerador de dados (PGD), 
732 

Processo iterativo, 526 
Processo puramente aleatorio, 735 
Processos de tendencia estacionaria 
estocastica (TE), 739-740 
Processos estacionarios de diferenga 
(PED), 739, 753 

Processos estocasticos, 734-738 
estacionarios, 734—735 
integrados, 740-741 
nao estacionarios, 735-736 
raiz unitaria, 748 
tendencia estacionaria/diferenga 
estacionaria, 739-740 
Processos estocasticos de diferenga 
estacionaria (DE), 
739-740 
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Processos estocasticos de raiz unitaria, 
738 

Processos estocasticos DS (veja 

Processos estocasticos de 
diferenga estacionaria) 
Processos estocasticos estacionarios, 
734-735 

Processos estocasticos integrados, 
740-741 

Processos estocasticos nao 

estacionarios, 735-738 
Processos integrados, 740-741 
Processos TE estocastica (veja 

Processos de tendencia 
estacionaria estocastica) 
Produgao CES (veja Elasticidade 

constante de substituigao) 
Produgao elasticidade de substituigao 
constante (CES), 34, 524 
Produtividade, 109, 604-606 
Produto interno bruto (PIB), 29-31, 
111,732-733 

Produto nacional bruto (PNB), 26 
Propensao marginal a consumir 

(PMC), 27, 29, 40, 102 
Propensao marginal a poupar (PMP), 
268 

Propositos de polftica, modelo usado 
para, 32 

Propriedade associativa 839 
Propriedade comutativa, 838 
Propriedade de invariancia, 826 
Propriedade de Slutsky, 826 
Propriedade finita, 95 
Propriedade reprodutiva, 161 
Propriedades assintoticas, 95, 116, 824 
Propriedades das amostras grandes 
116, 824-827 

Propriedades de amostras pequenas, 
822-824 

Propriedades estatfsticas, 81,91 
Propriedades numericas, dos 
estimadores, 81 
Psicologia, 618 

PSID (Estudo de Painel da Dinamica 
da Renda), 587 
PTE (Processo de tendencia 
estacionaria), 739 
Publicagdes da CIA, 897 

Q 

Qualidade, dos dados, 50 
Qualidade do ajustamento, 95-99, 
542-543 


Quase-equagao de diferenga 
generalizada, 443 
Quebras estruturais, 752 
Quedas geriatricas, 574-576 

R 

R 2 ajustado, 492 
r 2 bruto, 168 
Razao de chances, 551 
Razao inversa de Mills, 572 
Razao Von Neumann, 454 
Razdes T, 338-339, 345 
Realizagao de possibilidades, 734 
Recursos da World Wide Web, 
897-898 

Recursos estatisticos na Web/ 
Economia, 898 

Recursos para economistas na 
Internet, 897 

Redugao de determinante, 841 
Regiao de aceitagao, 136 
Regiao de aceitagao, 829 
Regiao de rejeigao, 136 
Regioes crfticas, 136, 829 
Regra de multiplicagao linha por 
coluna, 838 
Regra pratica 2/, 140 
Regra pratica de Klien, 347 
Regressando, 44 
Regressando nominal, 538 
Regressao, software, 35 
Regressao bivariada (veja Analise 
regressao de duas 
variaveis) 

Regressao combinada, 269 
Regressao de cointegragao, 756 
Regressao de corte transversal, 282 
Regressao de series temporais, 282 
Regressao dissimilar, 296 
Regressao espuria, 731, 741-742, 
747-748 

Regressao historica, 146 
Regressao linear sementada, 
305-307 
Regressao multipla: 

coeficientes de correlagao parcial, 
228-229 

estimagao de maxima 

verossimilhanga, 243 
modelos de regressao polinomial, 
225-228 

modelos linear vs. log-linear, 
272-273 

premissa de normalidade, 
246-247 


previsao com, 271 
problema de estimagao, 205-230 
problema de inferencia, 246-274 
teste da estabilidade estrutural/ 
parametro, 266-271 
teste da razao de verossimilhanga, 
286-287 

teste da significancia geral, 
250-259 
ANOVA, 251 

contribuigao incremental da 
variavel explanatoria, 
256-259 

em termos de R 2 , 255-256 
relagao entre R 2 e F, 254-255 
teste F, 251-253 
teste de hipotese sobre 

coeficientes de regressao 
individual, 248-250 
com testes LR/W/LM, 271-272 
formas de, 247-248 
teste de igualdade de coeficientes de 
duas regressoes, 259-261 
teste de restrigoes de igualdade 
linear, 261 

abordagem teste F, 262-266 
abordagem teste t, 261 
coeficiente de correlagao 
multiplo, 214 

coeficiente de determinagao 
multiplo, 213-214 
coeficientes parciais de 
regressao, 207-209 
estimagao dos coeficientes de 
regressao parcial, 209-212 
exemplo, 214-215 
fungao de produgao de 

Cobb-Douglas, 222-224 
interpretagao da equagao de 
regressao, 207 
modelo de tres variaveis R 2 
adjusted, 218-222 
notagao/premissas, 205-207 
variaveis padronizadas, 
regressao de, 215-216 
vies de especificagao, 216-217 
Regressao polinomial, 225-228 
Regressao populacional (PR), 62 
Regressao por etapas para frente, 354 
Regressao por etapas para tras, 300 
Regressao Ridge, 353 
Regressao sent sentido, 731 
Regressao universal, lei da, 39 
Regressao usando variaveis 
padronizadas, 869 
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Regressao: 

em variaveis padronizadas, 
175-176 

origem historica do termo, 39 
passando pela origem, 165-171 
"Regressao para mediocridade", 51 
Regressoes auxiliares, 346 
RegressSes coincidentes, 296, 297 
Regressoes concorrentes, 296-297 
Regressoes paralelas, 296 
Regressoes semilogaritmicas, 
307-308, 323 
Regressor, 44 

Regressores estritamente exogenos, 
467 

Regressores fixos, 85, 326-327, 508 
Regressores fracamente exogenos, 
467 

Rejeigao de hipotese, 139 
Relagao determinlstica, 28, 42 
Relagao exata, 28 
Relagao linear exata, 849 
Relagoes estatlsticas, 42 
Remogao de tendencia, 740 
Renda pessoal disponfvel (RPD), 
732-733 

Resfduos, 68, 446, 476 
Resfduos padronizados, 432 
Resfduos padronizados, 432n 
Resfduos recursivos, 496 
Restrigoes endpoint, 646 
Reversao media, 735 
RPD ( veja Renda pessoal disponfvel) 

S 

Sazonalidade, 778 
Semanais, 45 
Semielasticidade, 180 
Sentido amplo, processo estocastico, 
734 

Series temporais, 300 
Series temporais cointegradas, 
755-758 

Series temporais da economia 
americana, 732 
Series temporais de passeio 
aleatorio, 745 

Series temporais determinfsticas, 

739 

Series temporais estacionarias, 731 
Series temporais estocasticas, 739 
Series temporais integradas, 741 
Series temporais LPIB, 744-745 
Series temporais sem tendencia, 754 
Significancia estatistica: 


de coeficientes de autocorrelagao, 
746-748 

praticavs.. 142-143 
Significancia pratica, estatistica vs., 
143 

Slope drifter ( veja Coeficiente 
angular diferencial) 
Sobre-especificagao, de modelo, 
472-473 

Social security administration, 898 
Soma de matrizes, 837 
Soma de matrizes, 837 
Soma dos quadrados dos resfduos 
(SQR), 91, 96 

Soma dos quadrados dos resfduos 
irrestrita (SQS IR ), 269 
Soma dos quadrados dos resfduos 
restrita (SQRR), 269 
Soma dos quadrados explicada 
(SQE), 96 

Soma dos quadrados total (SQT), 96 
SQR (veja Soma dos quadrados dos 
resfduos) 

SQRNR (veja Soma dos quadrados 
dos resfduos nao restrita) 
SQRR ( veja Soma dos quadrados dos 
resfduos restrita) 

SQT (Soma dos quadrados total), 96 
SRM (veja Modelos de regressao 
switching) 

STATA, 895-896 
Suavizagao exponencial, 767 
Subdiferenciagao, 754 
Subespecificagao, 469-472 
Subestimou, 32 
Subidentificagao, 686-688 
Submatriz, 835 
Subtragao, matriz, 837 
Subtragao de matriz, 837 
Superdiferenciagao, 754 
Superidentificagao, 691-692 

T 


T (numero total de observagoes), 45 
, (subscrito), 44-45 
Tabela ANOVA, 144-145 
Tabelas estatlsticas, 875-890 
areas sob distribuigao normal 
padronizada, 875 
estatistica d de Durbin-Watson, 
885-886 

pontos percentuais da distribuigao 
t, 876 


pontos percentuais superiores da 
distribuigao de yy, 
883-884 

pontos percentuais superiores da 
distribuigao t, 877-892 
valores crfticos de 1% e 5% do t 
de Dickey-Fuller e 
valores crfticos de runs em testes 
run, 889-890 

valores F para testes de raiz 
unitaria, 890 

Tamanho da amostral, 797 
Tamanho: 

do teste estatfstico. 129n 
dos testes de raiz unitaria, 752 
Taxa de assessoria em fundos 
mutuos, 528-529 

Taxa de crescimento, instantanea vs. 
composta, 181 

Taxa de crescimento composta, 181 
Taxa de crescimento instantanea, 181 
Taxa de crescimento percentual, 
178n 

Taxa de desemprego civil (CUNR), 
891 

Taxa de inflagao dos norte- 

-americanos, 791-792 
Taxa de participagao da forga de 

trabalho civil (CLFPR), 
891, 892, 894-896 
Taxa de risco Hazard, 572 
Taxas de juros: 

e Federal Reserve, 638 
e investimentos/vendas, 660 
e moeda, 650 
e moeda /PIB/IPC, 703 
Tecnica de componentes principais, 
353 

Tecnica de estimagao SURE de 
Zellner, 708n 

Tecnica diferencial de intercepto 
dummy, 593 

Tela de resultado, 891-896 
EViews, 891-893 
Excel, 894-895 
MINITAB, 893-894 
STATA, 895 

Tendencia (veja tambem Nao 
tendencioso) 
autosselegao, 498 
em estimadores de mfnimos 

quadrados indiretos, 728 
equagao-simultanea, 673-677 
erro de medida, 468 
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especificagao (ve/a Tendencia de 
especificagao) 

especificagao de modelo, 466 
especificagao de variavel excluida, 
418 

pre-teste, 221 
Tendencia crescente, 181 
Tendencia decrescente, 181 
Tendencia determimstica, 739 
Tendencia determimstica com 

componente estacionario 
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